* ESC - закрити вікно пошуку
Microsoft
У Гарварді запустили ініціативу зі створення глобальної бази відкритих даних
02.01.2025Гарвардська бібліотека спільно з Microsoft, OpenAI та Google розпочали роботу над Institutional Data Initiative (IDI) — масштабним проєктом, спрямованим на публікацію оцифрованих колекцій бібліотек, музеїв та інших інституцій у вигляді структурованих даних. Про це йдеться на офіційному сайті ініціативи.
IDI буде використовувати дані для етичного навчання штучного інтелекту (ШІ), досліджень та створення відкритих баз знань. У межах проєкту вже розпочали оцифрування мільйона книжок з Гарвардської бібліотеки та мільйонів сторінок старих газет із Бостонської публічної бібліотеки. Окрім того, запланована і співпраця з Google Books, що значно спростить доступ до текстів.
Як наголошують засновники ініціативи, IDI працюватиме з бібліотеками, урядами, музеями та іншими інституціями по всьому світу, щоб збільшити доступ до якісних даних. Особливу увагу присвятять різноманітності джерел, культур, мов і тем для забезпечення інклюзивності даних й уникнення упередженості в ШІ.
Голова Microsoft Сатья Наделла зазначив: «Дані — це критично важливий ресурс для всіх розробників ШІ. Нам потрібна відкрита база даних, яка сприятиме розвитку глобальної екосистеми знань».
IDI активно залучає до співпраці некомерційні організації, університети, урядові установи та технологічні компанії.
Дата запуску загальнодоступної платформи ще не визначена, але розробники обіцяють забезпечити доступ до мільйона оцифрованих книжок для користувачів.
IDI є продовженням ініціативи Microsoft Open Data Campaign, запущеної у 2020 році. У межах цієї кампанії корпорація забезпечує доступ до академічних досліджень і даних для організацій усіх розмірів. Це дає можливість дослідникам, стартапам і великим компаніям використовувати відкриті дані.
Крім того, Microsoft підтримує CORE — платформу відкритого доступу, яка працює над покращенням доступу до академічних знань у всьому світі і розвитком етичного використання академічного контенту.
Нагадаємо, у 2024 році у Гарвардському університеті створили базу даних з джерелами з історії України.
Читайте також: ШІ в оформленні книжок — безцінний інструмент чи знецінення праці?
Чільне зображення: blogs.microsoft.com
This publication is sponsored by the Chytomo’s Patreon community
«Читомо» — це професійне медіа про книжки і книговидання в Україні та світі. Ми залишаємось незалежними лише завдяки коштам наших донаторів. Допоможіть нам розвиватися і ставати ще кращими!
Підтримати проєкт
що більше читаєш – то ширші можливості