Прэзентацыя навуковых распрацовак Цэнтра даследаванняў беларускай культуры, мовы і літаратуры НАН Беларусі на выставе “Штучны інтэлект у Беларусі”

13-14 кастрычніка 2025 г. адбыўся IV Міжнародны Форум ШІ-Акадэмграда “Штучны інтэлект у Беларусі”. У рамках Форума прайшла выстава, у якой прынялі ўдзел загадчык сектара камп’ютарнай лінгвістыкі Цэнтра даследаванняў беларускай культуры мовы і літаратуры НАН Беларусі Уладзімір Кошчанка і старшы навуковы супрацоўнік названага сектара Святлана Лазавая.

Спецыялісты сектара прэзентавалі комплекс інавацыйных праектаў, якія раскрываюць магчымасці прымянення штучнага інтэлекту ў апрацоўцы і аналізе беларускай мовы:

1. Тэхналогія стварэння тэкставага корпусу на аснове аўдыязапісаў з дапамогай тэхналогій штучнага інтэлекту.

Распрацавана тэхналогія аўтаматычнага распазнавання беларускага маўлення, якая дазваляе ўключаць аўдыязапісы у тэкставы корпус з дапамогай нейрасеткі Gemini. На яе аснове створаны прататып аўдыякорпуса.

2. Тэхналогія сінтэзу беларускага маўлення.

На аснове фанетычнага канвертара ўласнай распрацоўкі, Граматычнай базы беларускай мовы і нейрасетак GlowTTS і HiFiGAN створаны прататып сінтэзатара беларускага маўлення.

3. Лінгвістычная база ведаў пра беларускую мову і яе інтэграцыя з сістэмамі штучнага інтэлекту.

Распрацаваны падыход па стварэнні і інтэграцыі лінгвістычнай базы ведаў пра беларускую мовы на падставе навуковых звестак у сучасныя вялікія моўныя мадэлі, такія як ChatGPT, Gemini і інш.

Такі падыход дазволіць атрымаць спецыялізаваныя аналітычныя і генератыўныя інструменты для беларускай мовы, здольныя працаваць з высокай ступенню дэталізацыі. Гэта адкрывае новыя перспектывы для навуковых даследаванняў у галіне беларускай лексікі, граматыкі, семантыкі і іншых аспектаў, што раней было немагчыма з-за абмежаванасці агульнадаступных даных.

 

У. Кошчанка

 

Глядзіце таксама

  • Корпус беларускай мовы