Сегодня 03 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Microsoft AI представила три собственные ИИ-модели для генерации текста, голоса и изображений

Исследовательское подразделение Microsoft AI представило три новые модели искусственного интеллекта (ИИ), способные генерировать текст, голос и изображения. В конкурентной борьбе с ведущими технологическими ИИ-лабораториями компания решила усилить свои позиции сделав ставку на собственную мультимодальную инфраструктуру.

 Источник изображения: xAI

Источник изображения: xAI

Модель MAI-Transcribe-1 переводит речь на 25 языках в текст, опережая по скорости сервис Azure Fast в 2,5 раза. Вторая модель MAI-Voice-1 создаёт минутную аудиодорожку за одну секунду и поддерживает настройку голосов. MAI-Image-2 отвечает за генерацию визуального контента по текстовому описанию.

По сообщению TechCrunch, над проектом работала команда MAI Superintelligence, занимающаяся фундаментальными исследованиями в области продвинутых ИИ-систем, которую в ноябре 2025 года возглавил исполнительный директор подразделения Мустафа Сулейман (Mustafa Suleyman).

В текущем проекте разработчики сделали упор на снижение стоимости вычислений по сравнению с аналогами от Google и OpenAI. Тарификация расшифровки текста начинается от $0,36 в час, синтез речи оценивается в $22 за 1 миллион символов, а работа с изображениями обойдётся в $5 за 1 миллион входных токенов и $33 за генерацию 1 миллиона выходных токенов. Все модели уже развёрнуты на платформе Microsoft Foundry, а модели транскрипции и синтеза речи также доступны в MAI Playground.

Несмотря на активный выпуск собственных разработок, Сулейман в интервью VentureBeat подтвердил приверженность партнёрству с OpenAI, в которую Microsoft уже инвестировала более $13 млрд. Корпорация продолжит использовать модели OpenAI в своих продуктах в рамках многолетнего контракта, применяя ту же стратегию диверсификации, что и при работе с микрочипами.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Meta вложила миллиарды в ИИ, но Цукерберг признал: агенты не спешат умнеть 2 мин.
Сливший iOS 26 до анонса блогер свалил вину на своего сообщника 44 мин.
«Время — это конструкт»: научно-фантастический триллер Ontos от создателей Amnesia и Soma перенесли на 2027 год 56 мин.
Citrix анонсировала XenServer 9 — альтернативу решениям VMware 58 мин.
Американские правозащитники объявили соцсеть X серьёзной угрозой для конфиденциальности американцев 2 ч.
Relic анонсировала «захватывающую» роглайт-стратегию Company of Heroes 3: Final Stand — трейлер, дата выхода и подробности геймплея 2 ч.
Вопрос передачи доли в Anthropic властям США пока не обсуждался 7 ч.
Microsoft разрабатывала ИИ ОС, отличную от Windows — с глубокой интеграцией Copilot и агентов 12 ч.
Epic Games Store устроил раздачу классической игры I Have No Mouth, and I Must Scream о последних людях на Земле, которых пытает безумный суперкомпьютер 15 ч.
Авторитетный инсайдер опроверг закрытие Obsidian Entertainment и работу студии над новой Fallout 16 ч.
Sony уже придумала новое применение заводу, где делают диски для PlayStation 6 мин.
Самым популярным смартфоном в российской рознице в этом году стал iPhone 17 17 мин.
США разрешат сверхзвуковым авиалайнерам летать над городами, но при одном условии 42 мин.
Возвращение к DDR4 идёт полным ходом: Intel возобновила производство процессоров Raptor Lake 2 ч.
Учёные вдохновились пустельгой и разработают дрон, противостоящий порывам ветра 2 ч.
2 июля начали принимать работы для участия в фотоконкурсе «Снято на Camon» компании Tecno 2 ч.
Квартальные продажи Ethernet-коммутаторов взлетели на 40 %, а NVIDIA выбилась в лидеры в ЦОД-сегменте 3 ч.
Илон Маск признался, что объёмы выпуска роботов Tesla Optimus на первых порах будут скромными 4 ч.
Kioxia начала поставлять образцы передовой 332-слойной памяти 3D NAND десятого поколения 5 ч.
Новая статья: Снято в Голливуде? Почему Стэнли Кубрик физически не смог бы подделать лунную походку 10 ч.