Укрдержархів передав 10 терабайтів даних для навчання українського ШІ
Державна архівна служба України передала 10 терабайтів даних для тренування національної мовної моделі «Сяйво». Це унікальні історичні матеріали, документи та наукові тексти — обсяг, співмірний із приблизно 70 тисячами книжок.
Передані дані охоплюють різні типи джерел: рукописи, архівні документи, закони, судові рішення, медіаматеріали та словники. Вони стануть основою для створення українського ШІ, який краще розумітиме національний контекст і працюватиме з україномовним контентом без втрати змісту.
Проєкт реалізується за участі Міністерство цифрової трансформації України та ДП «Дія» у межах розвитку національної мовної моделі.
Створення власної мовної моделі є кроком до формування ШІ-суверенітету України та розвитку якісних цифрових сервісів на основі національних даних.
За словами голови Державної архівної служби України Анатолія Хромова, це перший випадок, коли архівні дані передаються для розвитку цифрових сервісів.
«До кінця 2026 року кількість цифрових копій у державних архівах має зрости з 150 до понад 200 мільйонів. Це один з найвищих у світі темпів оцифрування архівної спадщини», — наголосив Анатолій Хромов.
До проєкту вже долучилися понад 50 партнерів, серед яких медіа, університети та бібліотеки.
Охочим приєднатися потрібно заповнити форму: https://is.gd/7ZrXPJ
Підпишись на наш Телеграм