Как галлюцинации могут помочь ИИ лучше понять вас

Оглавление:

Как галлюцинации могут помочь ИИ лучше понять вас
Как галлюцинации могут помочь ИИ лучше понять вас
Anonim

Ключевые выводы

  • Новая модель машинного обучения галлюцинирует образ предложения на языке, чтобы облегчить перевод.
  • Система искусственного интеллекта, называемая VALHALLA, была разработана, чтобы имитировать то, как люди воспринимают язык.
  • Новая система является частью растущего движения за использование ИИ для понимания языка.
Image
Image

Человеческий метод визуализации изображений при переводе слов может помочь искусственному интеллекту (ИИ) лучше понять вас.

Новая модель машинного обучения галлюцинирует образ того, как выглядит предложение на языке. Согласно недавней исследовательской работе, эта техника использует визуализацию и другие подсказки, чтобы помочь с переводом. Это часть растущего движения за использование ИИ для понимания языка.

«То, как люди говорят и пишут, уникальны, потому что у всех нас немного разные тона и стили», - сказала Lifewire в интервью по электронной почте Бет Кадни, профессор аналитики данных в Университете Мэривилля, которая не участвовала в исследовании.. «Понимание контекста сложно, потому что это похоже на работу с неструктурированными данными. Именно здесь полезна обработка естественного языка (НЛП). НЛП - это ветвь ИИ, которая устраняет различия в том, как мы общаемся, используя понимание машинного чтения. Ключевое отличие НЛП, как ветвь ИИ, не фокусируется просто на буквальном значении слов, которые мы говорим или пишем. Он смотрит на смысл».

Иди, спроси Алису

Новая система искусственного интеллекта под названием VALHALLA, созданная исследователями из Массачусетского технологического института, IBM и Калифорнийского университета в Сан-Диего, была разработана для имитации того, как люди воспринимают язык. По мнению ученых, использование сенсорной информации, такой как мультимедиа, в сочетании с новыми и незнакомыми словами, такими как карточки с изображениями, улучшает усвоение и запоминание языка.

Эти системы расширяют возможности чат-ботов, которые в настоящее время только обучены и способны вести определенные разговоры…

Команда утверждает, что их метод повышает точность машинного перевода по сравнению с переводом только текста. Ученые использовали архитектуру кодер-декодер с двумя преобразователями, тип модели нейронной сети, подходящий для данных, зависящих от последовательности, таких как язык, который может обращать внимание на ключевые слова и семантику предложения. Один преобразователь генерирует визуальную галлюцинацию, а другой выполняет мультимодальную трансляцию, используя выходы первого преобразователя.

«В реальных сценариях у вас может не быть изображения относительно исходного предложения», - сказал в пресс-релизе один из членов исследовательской группы Рамешвар Панда. «Итак, наша мотивация в основном заключалась в следующем: вместо того, чтобы использовать внешнее изображение во время вывода в качестве входных данных, можем ли мы использовать зрительную галлюцинацию - способность представлять визуальные сцены - для улучшения систем машинного перевода?»

Понимание ИИ

Значительные исследования сосредоточены на развитии НЛП, отметил Кадни. Например, Илон Маск стал соучредителем Open AI, который работает над GPT-3, моделью, которая может общаться с человеком и достаточно сообразительна, чтобы генерировать программный код на Python и Java.

Google и Meta также работают над созданием диалогового ИИ с помощью своей системы под названием LAMDA. «Эти системы увеличивают мощность чат-ботов, которые в настоящее время только обучены и способны вести определенные разговоры, что, вероятно, изменит лицо службы поддержки клиентов и справочных служб», - сказал Кадни.

Аарон Сломан, соучредитель CLIPr, компании, занимающейся технологиями искусственного интеллекта, сказал в электронном письме, что большие языковые модели, такие как GPT-3, могут учиться на очень небольшом количестве обучающих примеров, чтобы улучшить резюме текста на основе отзывов людей. Например, по его словам, вы можете задать большой языковой модели математическую задачу и попросить ИИ думать шаг за шагом.

«Мы можем ожидать, что из больших языковых моделей будет извлечено больше информации и рассуждений, поскольку мы узнаем больше об их возможностях и ограничениях», - добавил Сломан. «Я также ожидаю, что эти языковые модели будут создавать более человекоподобные процессы, поскольку разработчики моделей разрабатывают более совершенные способы тонкой настройки моделей для конкретных задач, представляющих интерес».

Профессор вычислительной техники Технологического института Джорджии Дийи Ян предсказал в интервью по электронной почте, что мы увидим более широкое использование систем обработки естественного языка (NLP) в нашей повседневной жизни, начиная от персонализированных помощников на основе NLP и заканчивая помощью с электронной почтой и телефонными звонками. к знающим диалоговым системам для поиска информации в путешествиях или здравоохранении.«А также честные системы искусственного интеллекта, которые могут выполнять задачи и помогать людям ответственно и беспристрастно», - добавил Ян.

Огромные модели ИИ, использующие триллионы параметров, такие как GPT-3 и DeepText, будут продолжать работать над созданием единой модели для всех языковых приложений, предсказал Стивен Хейдж, инженер по машинному обучению в Dialexa, в интервью по электронной почте. Он сказал, что также будут новые типы моделей, созданные для конкретных целей, таких как онлайн-покупки с голосовым управлением.

«Примером может быть покупатель, говорящий: «Покажите мне эти тени для век темно-синего цвета с большим ореолом», чтобы показать этот оттенок на глазах человека с некоторым контролем над тем, как он наносится», - добавила Хейдж.

Рекомендуемые: