0 added
0 removed
Original
2026-01-01
Modified
2026-02-21
1
<p>Компания OpenAI<a>анонсировала</a>новую ИИ-модель o3. Кроме того, была представлена её младшая версия o3-mini. Сегодня это самые мощные языковые модели среди всех, что создавала OpenAI. Интересная деталь: в названии разработчик решил пропустить цифру 2, чтобы не вызвать судебных разбирательств с британским телеком-оператором O2.</p>
1
<p>Компания OpenAI<a>анонсировала</a>новую ИИ-модель o3. Кроме того, была представлена её младшая версия o3-mini. Сегодня это самые мощные языковые модели среди всех, что создавала OpenAI. Интересная деталь: в названии разработчик решил пропустить цифру 2, чтобы не вызвать судебных разбирательств с британским телеком-оператором O2.</p>
2
<p>По данным OpenAI, o3 показала высокий результат в ARC-бенчмарке. С его помощью тестируют технологии, которые могут перейти к следующему уровню искусственного интеллекта. Так, новая ИИ-модель от OpenAI набрала 87,5% - это намного больше, чем у o1, которая достигла показателя лишь в 32%. Однако стоимость выполнения задач оказалась очень высокой. По предварительной информации, она может составлять до 2 тысяч долларов.</p>
2
<p>По данным OpenAI, o3 показала высокий результат в ARC-бенчмарке. С его помощью тестируют технологии, которые могут перейти к следующему уровню искусственного интеллекта. Так, новая ИИ-модель от OpenAI набрала 87,5% - это намного больше, чем у o1, которая достигла показателя лишь в 32%. Однако стоимость выполнения задач оказалась очень высокой. По предварительной информации, она может составлять до 2 тысяч долларов.</p>
3
<em>Изображение:<a>OpenAI</a>/<a>Reddit</a></em><p>Кроме того, нейросеть показала высокий результат на экзамене по математике AIME, который проводится в США. Модель получила 96,7 балла и не справилась только с одним вопросом. А ещё o3 набрала 87,7% на экзамене GPQA Diamond - это значительно превышает результаты экспертов-людей.</p>
3
<em>Изображение:<a>OpenAI</a>/<a>Reddit</a></em><p>Кроме того, нейросеть показала высокий результат на экзамене по математике AIME, который проводится в США. Модель получила 96,7 балла и не справилась только с одним вопросом. А ещё o3 набрала 87,7% на экзамене GPQA Diamond - это значительно превышает результаты экспертов-людей.</p>
4
<p>В бенчмарке Frontier Math новой модели удалось установить показатель в 25,2%. Для сравнения: другие ИИ-модели не набирали больше 2%. У o3-mini результаты оказались скромнее, однако в OpenAI заявили, что она превосходит по возможностям o1.</p>
4
<p>В бенчмарке Frontier Math новой модели удалось установить показатель в 25,2%. Для сравнения: другие ИИ-модели не набирали больше 2%. У o3-mini результаты оказались скромнее, однако в OpenAI заявили, что она превосходит по возможностям o1.</p>
5
<p>Обе новые модели пока недоступны для пользователей. Сейчас OpenAI собирает заявки от исследователей, которые займутся тестированием o3 и o3-mini. Для получения доступа к o3 и o3-mini необходимо подать заявку на сайте OpenAI до 10 января 2025 года. Компания призывает исследователей разрабатывать надёжные оценки и тестировать модели в уникальных сценариях.</p>
5
<p>Обе новые модели пока недоступны для пользователей. Сейчас OpenAI собирает заявки от исследователей, которые займутся тестированием o3 и o3-mini. Для получения доступа к o3 и o3-mini необходимо подать заявку на сайте OpenAI до 10 января 2025 года. Компания призывает исследователей разрабатывать надёжные оценки и тестировать модели в уникальных сценариях.</p>
6
<p>"Это начало нового этапа в развитии AI. Мы видим потенциал этих моделей в решении сложных задач, предполагающих большое количество рассуждений".</p>
6
<p>"Это начало нового этапа в развитии AI. Мы видим потенциал этих моделей в решении сложных задач, предполагающих большое количество рассуждений".</p>
7
<p><strong>Сэм Альтман</strong>, гендиректор OpenAI</p>
7
<p><strong>Сэм Альтман</strong>, гендиректор OpenAI</p>
8
<p>В OpenAI отметили, что компания уделяет большое внимание безопасности и согласованности своих ИИ-моделей. А её новый метод сознательного выравнивания позволяет моделям рассуждать и о политике безопасности. Это снижает риск уязвимостей и улучшает соответствие рекомендациям по содержанию.</p>
8
<p>В OpenAI отметили, что компания уделяет большое внимание безопасности и согласованности своих ИИ-моделей. А её новый метод сознательного выравнивания позволяет моделям рассуждать и о политике безопасности. Это снижает риск уязвимостей и улучшает соответствие рекомендациям по содержанию.</p>
9
<p>Ожидается, что релиз o3-mini состоится в конце января 2025 года. Дата выхода o3 пока неизвестна.</p>
9
<p>Ожидается, что релиз o3-mini состоится в конце января 2025 года. Дата выхода o3 пока неизвестна.</p>