https://sakana.ai/careers
From day one, we’ve taken a different path. Our research has always focused on developing efficient AI technology sustainably, driven by the belief that resource constraints—not limitless compute—are key to true innovation.
From day one, we’ve taken a different path. Our research has always focused on developing efficient AI technology sustainably, driven by the belief that resource constraints—not limitless compute—are key to true innovation.
東京都の公式メディア「TOKYO UPDATES」に、Sakana AIリサーチサイエンティストのカラーヌワット・タリンのインタビューが掲載されました。
www.tokyoupdates.metro.tokyo.lg.jp/post-1670/
日本の貴重な文化資源を活用することで、日本に根ざしたAI技術の実現を目指す取り組みについて、ぜひご一読ください。
東京都の公式メディア「TOKYO UPDATES」に、Sakana AIリサーチサイエンティストのカラーヌワット・タリンのインタビューが掲載されました。
www.tokyoupdates.metro.tokyo.lg.jp/post-1670/
日本の貴重な文化資源を活用することで、日本に根ざしたAI技術の実現を目指す取り組みについて、ぜひご一読ください。
GPT-5 now leads our Sudoku-Bench leaderboard with 33% solve rate, ~2x the previous best, and is the first LLM to solve a 9x9 modern Sudoku.
Still, 67% of puzzles remain unsolved.
Read more about our update here:
🔗 Blogpost → pub.sakana.ai/sudoku-gpt5/
🧵 Thread 👇
GPT-5 now leads our Sudoku-Bench leaderboard with 33% solve rate, ~2x the previous best, and is the first LLM to solve a 9x9 modern Sudoku.
Still, 67% of puzzles remain unsolved.
Read more about our update here:
🔗 Blogpost → pub.sakana.ai/sudoku-gpt5/
🧵 Thread 👇
pub.sakana.ai/pdnca/
In this work we explore the role of continual adaptation in artificial life, where the cellular automata in our system do not rely on a fixed set of parameters, but rather learn continuously during the simulation itself.
pub.sakana.ai/pdnca/
In this work we explore the role of continual adaptation in artificial life, where the cellular automata in our system do not rely on a fixed set of parameters, but rather learn continuously during the simulation itself.
“You should only do the research that wouldn’t happen if you weren’t doing it.” (Brian Cheung) 🧠💡
venturebeat.com/ai/sakana-ai...
“You should only do the research that wouldn’t happen if you weren’t doing it.” (Brian Cheung) 🧠💡
venturebeat.com/ai/sakana-ai...
1) Adaptive parent sampling to balance exploration and exploitation.
2) Novelty-based rejection filtering to avoid redundant work.
3) A bandit-based LLM ensemble that dynamically picks the best model for the job.
1) Adaptive parent sampling to balance exploration and exploitation.
2) Novelty-based rejection filtering to avoid redundant work.
3) A bandit-based LLM ensemble that dynamically picks the best model for the job.
1/ AIME Math Reasoning: It evolved sophisticated agentic scaffolds that significantly outperform strong baselines, discovering a Pareto frontier of solutions trading performance for efficiency.
1/ AIME Math Reasoning: It evolved sophisticated agentic scaffolds that significantly outperform strong baselines, discovering a Pareto frontier of solutions trading performance for efficiency.
Blog: sakana.ai/shinka-evolve/
Paper: arxiv.org/abs/2509.19349
Blog: sakana.ai/shinka-evolve/
Paper: arxiv.org/abs/2509.19349
We’re truly grateful for the recognition and will continue our mission to build a frontier AI company in Japan.
Thank you for your support!
We’re truly grateful for the recognition and will continue our mission to build a frontier AI company in Japan.
Thank you for your support!
Excited to share our new paper, “Competition and Attraction Improve Model Fusion” presented at GECCO 2025 (runner-up for best paper)!
arxiv.org/abs/2508.16204
Excited to share our new paper, “Competition and Attraction Improve Model Fusion” presented at GECCO 2025 (runner-up for best paper)!
arxiv.org/abs/2508.16204
sakana.ai/careers/#sof...
Sakana AIにおけるSoftware Engineerは、Applied Teamの一員としてビジネスのインパクトにつながるプロダクト開発を行っています。Frontend、Backend、Infrastructure構築の全体にわたって、AI技術を組み込んだアプリケーションの設計・開発に挑戦いただける方のご応募をお待ちしております!
sakana.ai/careers/#sof...
Sakana AIにおけるSoftware Engineerは、Applied Teamの一員としてビジネスのインパクトにつながるプロダクト開発を行っています。Frontend、Backend、Infrastructure構築の全体にわたって、AI技術を組み込んだアプリケーションの設計・開発に挑戦いただける方のご応募をお待ちしております!
sakana.ai/open-house-2...
イベントでは共同創業者2名も登壇し、研究開発とビジネスの両輪をどう回し、日本や世界の産業・コミュニティにどう貢献していくかを語りました。また、現場で活躍するAppliedチームのメンバーが、チームの特徴や働き方、AIエージェント開発の実態、Researchチームとの連携などについて紹介しました。
sakana.ai/open-house-2...
イベントでは共同創業者2名も登壇し、研究開発とビジネスの両輪をどう回し、日本や世界の産業・コミュニティにどう貢献していくかを語りました。また、現場で活躍するAppliedチームのメンバーが、チームの特徴や働き方、AIエージェント開発の実態、Researchチームとの連携などについて紹介しました。
Sakana AIでは、当社AI技術の社会実装のフェーズに進むことに伴い、一人目のUI/UXデザイナーを募集します。
詳細: sakana.ai/careers/#uiu...
お任せしたいのはプロダクトのコンセプト設計から、プロトタイプの作成、ユーザーテストまでの全てのプロセス。AIによる価値実現に向け、目下成長するApplied Teamの一員として、Sakana AIのプロダクトづくりに挑んでくださる、意欲ある方のご応募をお待ちしています!
Sakana AIでは、当社AI技術の社会実装のフェーズに進むことに伴い、一人目のUI/UXデザイナーを募集します。
詳細: sakana.ai/careers/#uiu...
お任せしたいのはプロダクトのコンセプト設計から、プロトタイプの作成、ユーザーテストまでの全てのプロセス。AIによる価値実現に向け、目下成長するApplied Teamの一員として、Sakana AIのプロダクトづくりに挑んでくださる、意欲ある方のご応募をお待ちしています!
Sakana AI採用情報: sakana.ai/careers/
Sakana AI採用情報: sakana.ai/careers/
sakana.ai/applied-team...
Sakana AIでは、世界トップレベルの生成AI技術を社会実装するために「Applied Team」を本格始動しています。 Applied Teamについて知っていただくことを目的として、AI研究の社会実装に挑む二人のメンバーのインタビュー記事を公開しました。
「事業専門性とR&Dの強みが社内に揃っているスタートアップの環境は、世界で見ても非常に珍しいのではないかと思います。」
sakana.ai/applied-team...
Sakana AIでは、世界トップレベルの生成AI技術を社会実装するために「Applied Team」を本格始動しています。 Applied Teamについて知っていただくことを目的として、AI研究の社会実装に挑む二人のメンバーのインタビュー記事を公開しました。
「事業専門性とR&Dの強みが社内に揃っているスタートアップの環境は、世界で見ても非常に珍しいのではないかと思います。」
Sakana AIのApplied Research Engineer、太田真人が共著者を務める『現場で活用するための AIエージェント実践入門』(講談社)が刊行されました。進歩を続けるAIエージェント技術を実践に繋げるための知見が満載ですので、ぜひご覧ください!
Amazon: www.amazon.co.jp/dp/4065401402/
8/7開催のApplied Engineer Open Houseには太田も登壇します。ご参加お待ちしています!
Event: connpass.com/event/362760/
Sakana AIのApplied Research Engineer、太田真人が共著者を務める『現場で活用するための AIエージェント実践入門』(講談社)が刊行されました。進歩を続けるAIエージェント技術を実践に繋げるための知見が満載ですので、ぜひご覧ください!
Amazon: www.amazon.co.jp/dp/4065401402/
8/7開催のApplied Engineer Open Houseには太田も登壇します。ご参加お待ちしています!
Event: connpass.com/event/362760/
評価用LLMとしてClaude-3.5-SonnetやQwen-2.5-72B-Instructを用いた場合、その評価結果は人間の評価者にとって妥当なものでした。また、Claude-3.5-SonnetをはじめとするLLMが付与したスコアは、人間の評価者によるスコアと高い相関を示しました。
評価用LLMとしてClaude-3.5-SonnetやQwen-2.5-72B-Instructを用いた場合、その評価結果は人間の評価者にとって妥当なものでした。また、Claude-3.5-SonnetをはじめとするLLMが付与したスコアは、人間の評価者によるスコアと高い相関を示しました。