GigaChat 2.0 Сбербанка стал доступен каждому пользователю. Благодаря новому подходу к обучению повысился уровень всех навыков модели. Искусственный интеллект научился распознавать голосовые аудиофайлы, глубже анализировать запросы пользователя, обрабатывать больший объем текста и распознавать изображения. Все возможности GigaChat доступны в одном продукте и на любой поверхности — таким образом пользователю не нужно переключаться между разными сервисами.
В модельный ряд вошли две версии на выбор пользователя — GigaChat 2 Pro и GigaChat 2 Max. Max — это самая продвинутая модель для решения сложных и профессиональных задач, а Pro подойдет для решения повседневных задач, от получения ответов на различные вопросы до создания и редактирование текстов.
Работа с актуальной информацией в режиме реального времени
GigaChat 2.0 теперь умеет работать с актуальными данными из интернета, сервис глубже анализирует запросы, выдавая лаконичные ответы с ссылками на источники. Искусственный интеллект найдет информацию за человека, отфильтрует главное и подкрепит свои выводы ссылками — по ним можно будет перейти, если пользователю понадобится дополнительная информация. Например, у модели можно спросить: «Куда сходить в Питере с детьми 7 и 12 лет на этих выходных»; «Сколько стоит отремонтировать стандартную однушку в Москве».
Поддержка текстовых файлов
Теперь в одном диалоге доступна работа с несколькими файлами. В чат можно загрузить документ до 200 страниц текста А4. Пример запроса: «На что мне обратить внимание в договоре аренды? Ориентируйся на законы России». Также нужно приложить сам договор.
Анализ аудиофайлов и голосовых сообщений
GigaChat 2.0 обрабатывает аудиофайлы на принципиально новом уровне — модель воспринимает звуковые данные напрямую, без промежуточного преобразования в текст. Это позволяет ей точнее выделять главное и отвечать на вопросы по содержанию – достаточно приложить запись и сформулировать запрос. Поддерживает файлы длительностью до 60 минут и 30 МБ. А если печатать неудобно или нет возможности, можно записать голосовое сообщение. GigaChat 2.0 умеет общаться на разных языках, лучше понимает сложные термины, качественнее распознает устную речь и акцент, а также посторонние звуки и музыку.
Примеры запросов: «Послушай аудиозапись и скажи, что в моих словах могло не понравиться коллеге»; «Выпиши список лекарств и рекомендаций из голосового от моего врача»; «Послушай запись видеозвонка и выпиши все, что говорилось о наружной рекламе»; «Помоги структурировать мою речь для презентации проекта. [Текст речи]».
Анализ ссылок
Теперь достаточно загрузить ссылки на нужные материалы — и GigaChat извлечет важную информацию. Модель создает краткие обзоры по материалам сайтов, сравнивает статьи на одну тему, одновременно работает с несколькими ссылками и распознает картинки с сайтов. Пример запроса: «Помоги подготовиться к собеседованию на эту вакансию».
Суммаризация и ответы на вопросы по видео
GigaChat 2.0 способен также обрабатывать видео по ссылке. За счет понимания аудиодорожки модель может рассказать основную суть видеоэссе или ответить на вопросы по лекции (работает также с английским и другими языками). Пример запроса: «О чем видео? ссылка».
Распознавание изображений
Модель может проанализировать и извлечь из картинки больше полезной информации и дает более точные ответы по ее содержанию. Например, может посоветовать, какой стиль одежды выбрать для конкретного случая, поможет решить уравнение из учебника или расшифровать медицинские анализы. Пример запроса: «Мне пришла квитанция ЖКХ. Объясни, за что я плачу?
Источник: CNews