Какие модели есть на платформе
Модели Anthropic Claude
Claude Opus 4 и Claude Sonnet 4.
Это мультимодальные модели. Они могут получать на вход текст, изображение, PDF-файл или офисный документ. На выходе они всегда дают текст.
Они понимают текст на картинках, анализируют графики и диаграммы, распознают схемы и скриншоты. Загрузить к ним можно изображение в формате JPEG, PNG, GIF или WebP, документ в формате DOCX, TXT, HTML, ODT, RTF, EPUB, таблицы XLSX или CSV, а также PDF-файлы до 100 страниц.
Важное ограничение: размер файла не должен превышать 30 мегабайт. PDF длиннее 100 страниц обрабатывается только по тексту — визуальные элементы игнорируются.
Модели Claude не работают с архивами ZIP и RAR, а также с файлами Apple Pages, Numbers и Keynote.
Модели генерации видео — RunwayML
Gen4 Turbo.
Эта модель получает на вход изображение и текстовый запрос. Они работают в паре: изображение служит первым кадром, а текстовый запрос описывает желаемое движение. На выходе получается видео длительностью 5 или 10 секунд в формате MP4.
Gen4 Turbo — ускоренная версия для быстрого прототипирования.
Модели генерации видео — Veo
Veo 3.1 Fast, Veo 3.1 и Veo 3.
Все модели Veo умеют создавать видео двумя способами: из одного текстового запроса или из изображения с текстовым промптом. На выходе получается видео со встроенным звуком, включая диалоги, звуковые эффекты и музыку.
Veo 3.1 Fast — ускоренная версия для быстрой генерации. Разрешение до 1080p, длительность 4, 6 или 8 секунд.
Veo 3.1 — флагманская версия с поддержкой разрешения 4K, улучшенной физикой движений и возможностью задать начальный и конечный кадры.
Veo 3 — предыдущая версия. Модели Veo 2 и Veo 3 будут полностью отключены 30 июня 2026 года. Рекомендуется использовать Veo 3.1.
Модели генерации видео — Gen3A Turbo
Gen3A Turbo.
Эта модель получает на вход изображение и текстовый промпт. Оба обязательны. Один текстовый промпт без картинки модель не принимает. На выходе — видео.
Подсказки на доске
В списке моделей рядом с названием в виде подсказки указывается формат обработки:
Название модели — что получает на вход — что выдаёт на выходе.
Подсказки показывают, можно ли к модели прикрепить картинку, нужен только текст или нужны и картинка, и текст вместе.
Как выбрать модель для запроса или промта/запроса
При наличии текста, картинки, PDF или документа и при необходимости получить текстовый ответ выбрать Claude Opus 4 или Claude Sonnet 4.
При наличии картинки и текстового описания желаемого движения и при необходимости получить видео выбрать Gen4 Turbo.
При наличии только текста и при необходимости получить видео по этому описанию выбрать любую модель Veo с подсказкой Текст — видео.
При наличии картинки и при необходимости получить видео на её основе выбрать любую модель Veo с подсказкой Изображение и текст — видео.
При наличии картинки и при необходимости быстро получить видео без сложных настроек выбрать Gen3A Turbo.
При загрузке картинки в Claude модель опишет её текстом, а не сделает видео. Для получения видео выбрать Veo или RunwayML.
Форматы файлов
Для Claude: изображения JPEG, PNG, GIF, WebP, документы DOCX, TXT, HTML, ODT, RTF, EPUB, таблицы XLSX, CSV, PDF до 100 страниц. Размер файла не больше 30 мегабайт.
Для генерации видео через Gen4 Turbo, Gen3A Turbo или Veo: на вход подать изображение в формате PNG или JPG. Текстовый промпт пишется словами.
На выходе во всех случаях получается видео в формате MP4.
Длительность видео: для Gen4 Turbo — 5 или 10 секунд, для Veo — до 8 секунд. Любой загружаемый файл не тяжелее 50 мегабайт.