13-14 кастрычніка 2025 г. адбыўся IV Міжнародны Форум ШІ-Акадэмграда “Штучны інтэлект у Беларусі”. У рамках Форума прайшла выстава, у якой прынялі ўдзел загадчык сектара камп’ютарнай лінгвістыкі Цэнтра даследаванняў беларускай культуры мовы і літаратуры НАН Беларусі Уладзімір Кошчанка і старшы навуковы супрацоўнік названага сектара Святлана Лазавая.
Спецыялісты сектара прэзентавалі комплекс інавацыйных праектаў, якія раскрываюць магчымасці прымянення штучнага інтэлекту ў апрацоўцы і аналізе беларускай мовы:
1. Тэхналогія стварэння тэкставага корпусу на аснове аўдыязапісаў з дапамогай тэхналогій штучнага інтэлекту.
Распрацавана тэхналогія аўтаматычнага распазнавання беларускага маўлення, якая дазваляе ўключаць аўдыязапісы у тэкставы корпус з дапамогай нейрасеткі Gemini. На яе аснове створаны прататып аўдыякорпуса.
2. Тэхналогія сінтэзу беларускага маўлення.
На аснове фанетычнага канвертара ўласнай распрацоўкі, Граматычнай базы беларускай мовы і нейрасетак GlowTTS і HiFiGAN створаны прататып сінтэзатара беларускага маўлення.
3. Лінгвістычная база ведаў пра беларускую мову і яе інтэграцыя з сістэмамі штучнага інтэлекту.
Распрацаваны падыход па стварэнні і інтэграцыі лінгвістычнай базы ведаў пра беларускую мовы на падставе навуковых звестак у сучасныя вялікія моўныя мадэлі, такія як ChatGPT, Gemini і інш.
Такі падыход дазволіць атрымаць спецыялізаваныя аналітычныя і генератыўныя інструменты для беларускай мовы, здольныя працаваць з высокай ступенню дэталізацыі. Гэта адкрывае новыя перспектывы для навуковых даследаванняў у галіне беларускай лексікі, граматыкі, семантыкі і іншых аспектаў, што раней было немагчыма з-за абмежаванасці агульнадаступных даных.
У. Кошчанка