Читаючі машини: вчені провели експеримент, який показав майбутнє книг

Протягом всієї людської історії книги постійно видозмінювалися. Книга, яку ми тримаємо в руках сьогодні, з’явилася завдяки ряду матеріалів (глина, папірус, пергамент, папір) і форм (табличка, сувій і так далі).

Книга може бути інструментом спілкування, читання, розваги або навчання; об’єктом і символом статусу.

Останній перехід від друкованих ЗМІ до цифрових технологій почався приблизно в середині 20-го століття. Кульмінацією його стали два амбітних проекти в історії книги (принаймні, якщо вірити корпоративної галасі): масова оцифрування книг Google і масове поширення електронних книг Amazon.

Виживання книжкових магазинів і процвітання бібліотек (в реальному житті) спростовує прогнози про те, що “кінець книги” близький. Але навіть самий войовничий бібліофіл визнає, що цифрові технології знову поставили під сумнів ідею” книги.

Машина для читання книг

Зчитує машина використовує комп’ютерне зір і оптичне розпізнавання символів, щоб ідентифікувати текст у будь-якій відкритій книзі, вміщеній під її двома камерами. Потім вона використовує машинне навчання і технологію обробки природної мови, щоб “прочитати” текст на предмет змісту і вибрати коротку поетичну комбінацію слів на сторінці, яку зберігає, стираючи в цифровому вигляді всі інші слова на сторінці.

Озброївшись цим згенерованим віршем, читає машина шукає в інтернеті зображення: часто це каракулі або мем, яким хтось поділився і який був збережений в Google Images. Так штучний інтелект намагається проілюструвати текст.

Металева побутівка перетворилася на затишний дачний будиночок – довго, зате дешево
6 порад щодо запобігання зараження в закладі громадського харчування
“Ягоди – в холодильнику, апельсини – на столі”: де зберігати овочі і фрукти

Після того як кожна сторінка книги була прочитана, інтерпретована і проілюстрована, система публікує результати, використовуючи онлайн-сервіс друку. Отриманий тому потім додається до зростаючого архіву, який називається бібліотекою нелюдських книг.

Так яке ж відношення все це має до масової оцифрування книг?

Зіткнувшись із зростаючим опором з боку авторів і видавців, пов’язаних з управлінням авторськими правами Google, инфогломерат згорнув від своєї основної мети безкоштовного надання до більш скромною індексної системи, використовуваної для пошуку книг, відсканованих Google. Тепер Google буде надавати лише короткі фрагменти, виділені на вихідній сторінці.

Пізніше Google визначив інше використання цих текстів. Мільйони відсканованих книг можуть бути використані в області, званої обробкою природної мови. Це дозволить комп’ютерам спілкуватися з людьми, використовуючи звичайну мову, а не код. Книги, спочатку відскановані для людей, стали доступні машин для вивчення, а потім і для наслідування людської мови.

Алгоритмічні процеси, такі як нейролінгвістичне програмування і машинне навчання, несуть у собі обіцянку (або загрозу) відкласти більшу частину повсякденного читання на машини.

Актори серіалу “Офіс” повідали про улюблених епізодах в честь 15-річчя шоу
І адреналін, і повага: підводна фотографія – хобі для романтиків
Любов важливіше всього. Настя Каменських порадувала передплатників новим фото з чоловіком

Синдром Емерсона

Синдром Емерсона підкреслює суб’єктивність, яку ми привносимо в читання. Коли вчені почали працювати над машиною для читання, вони зосередилися на виявленні патернів слів всередині великих масивів текстів, які завжди були там, але залишалися прихованими з виду”. “Кожна спроба читаючої машини породжувала нові вірші, всі вони були зроблені з слів, які залишалися на своїх початкових місцях на сторінках книг”.

Ідея єдиної книги, що складається з нескінченного числа читань, не нова. Програмісти спочатку задумали читає машину як спосіб створення міфічної книги з піску, описаної Хорхе Луїсом Борхесом у його притчі 1975 року.

Історія Борхеса – це зустріч оповідача з нескінченною книгою, яка безперервно перекомбинирует свої слова і образи. Багато хто порівнювали цю неможливу книгу з сучасним інтернетом. Читає машина, перевертаючи кожну сторінку будь-якої фізичної книги, обчислює комбінації слів на цій сторінці, які до цього моменту були видні, але не сприймалися свідомо читачем.

Спочатку програма називалася “Сховати аркуш”. Назва виникла випадково, коли прототипу читаючої машини була представлена сторінка з книги оповідань Борхеса. Повне пропозицію, з якого були взяті слова: “Десь я читав, що краще місце, де можна сховати аркуш, – це ліс”.

Прихований вірш, який машина намагається виявити в книгах, також ховається на увазі, як листя в лісі.

Підбиваючи підсумок

Розробники нейромережі вірять, що зможуть написати алгоритм, який стане відкриттям в літературі і зможе писати осмислені тексти, звільнивши від цієї людини.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

*

code