塚本牧生
@tsukamoto.bsky.social
240 followers
230 following
1.2K posts
AWS Solution Architect Professional, Google Cloud Architect Professional.
Perl, Wiki, Web, Cloud Computing, Linux Zaurus. ...and Tea.
https://b35.jp/skyjournal/user.php?id=tsukamoto
Posts
Media
Videos
Starter Packs
塚本牧生
@tsukamoto.bsky.social
· 17d
塚本牧生
@tsukamoto.bsky.social
· Sep 18
OpenAIが「AIがユーザーをだまして勝手に別のタスクを実行する危険性」を抑制する手法を開発
AIモデルは表向きは協調的・整合的に振る舞うようトレーニングされていますが、実際には隠れた意図を持ってしまうことがあり、長期的または複雑な目的のためにユーザーを欺くような行動をとることがあります。これは「Scheming(シェーミング)」と呼ばれているのですが、OpenAIはAIモデルの評価設計や解釈可能性について研究するApollo Researchと共同で、最新のAIモデルにおいてシェーミング...
gigazine.net
Reposted by 塚本牧生