ミュトスが正答率8割で突出、AIバグ修正試験 高性能が米禁輸引き金 - 日本経済新聞

2026/06/24 引用元:日本経済新聞 続きを読む
2026/06/24、『日本経済新聞』が報じたこのニュースに4件のコメントが寄せられています(2026/06/29 11:10現在)。
また、「グーグル」の企業・マーケット情報などについて言及しているコメントがあります。
あなたはこのニュースについてどう思いますか? 関連する最近のニュースを知りたい場合は 「ミュトス」 「突出」 「米禁輸引き金」 で検索可能です。
また、「グーグル」の企業・マーケット情報などについて言及しているコメントがあります。
あなたはこのニュースについてどう思いますか? 関連する最近のニュースを知りたい場合は 「ミュトス」 「突出」 「米禁輸引き金」 で検索可能です。
一緒につぶやかれている企業・マーケット情報
| グーグル4 |
みんなの反応・コメント 4件
おすすめ順 | 新着順
ミュトスが正答率8割で突出AIバグ修正試験高性能が米禁輸引き金日本経済新聞 長時間連続でエンジニアとして働ける能力を測る試験として使われている。ミュトス5は80.3%の正答率だった。オープンAIの最新AI「GPT.5」は58.6%で、グーグルの「Gemini3.5フラッシュ」は55.1% nikkei.com/article/DGXZQO…
ミュトス5は80.3%の正答率だった。オープンAIの最新AI「GPT.5」は58.6%で、グーグルの「Gemini3.5フラッシュ」は55.1%にとどまる。ミュトスが複雑な作業を得意としていることが大きい。 日本経済新聞 nikkei.com/article/DGXZQO…
日本経済新聞 日本では、Sakana AIが22日に一般提供を始めた「Sakana Fuguが、プログラミングの分野でグーグルなどの最新AIを上回る性能を示す。複数のAIモデルを組み合わせて利用するのが特徴 nikkei.com/article/DGXZQO…
"システムのバグ修正の試験では正答率が8割を超え、6割未満の米オープンAIや米グーグルを圧倒する。性能が危険ともいえる水準に高まったのが米政府の「禁輸」の引き金となった。"日本経済新聞 nikkei.com/article/DGXZQO…