#言語モデル
有志の方によるまとめサイトもありますので、こちらもぜひご確認ください。

ページが多いが!?

本当にそうですね。
それだけ問題点があり過ぎる……ということです。

penpengin.notion.site/AI-6a9feac16...

ひとまずコアな情報を探りたいなら、

『データセット問題』
penpengin.notion.site/0798289d0501...

『ChatGPTなどの大規模言語モデル問題』
penpengin.notion.site/ChatGPT-LLM-...

をご覧ください。
生成AIに関する問題・リスク・規制などの情報まとめ | Notion
生成AIの問題、リスク、規制などに関する関連記事やサイトをまとめました。
penpengin.notion.site
November 11, 2025 at 1:51 AM
日本の国会で取り上げるなら生成AIはLLM(大規模言語モデル)で、以前から変わらず詐欺師の小遣い稼ぎにしか使われてないのに電力消費量が桁違いに増加してるのは非常に由々しき事態であるという事実もちゃんと指摘して欲しいです。
結局大事なのは「中身がどういうものか」だと何故分からんのだ?
November 7, 2025 at 5:44 AM
話が飛ぶように感じるかもだけど、わたしは言語生優位のタイプなんだけど、言語性が著しく低いタイプの娘(※母娘共々病院で専門の検査済み)を25年以上育てて、うっわコイツとマジで合わねーな…って思いつつも絶対に理解しなきゃいけない立場をやり続けて、言語性がどんなに頑張っても手に入らない人の生きにくさを目の当たりにして、大規模言語モデル生成AIの素晴らしさを感じたよね
自閉スペクトラム症でも感じるもん、少なくとも二次元なら社会的に困らなくなった
それが言語モデルじゃない映像や音声や音楽や画像だとして、元々それを簡単に操れない特性のある人の感動分かるかね?
November 3, 2025 at 4:11 PM
EU公式24言語と日本語を含むその他11言語に対応したヨーロッパ製の大規模言語モデル「EuroLLM」がオープンソースで公開中なので実際に使ってみたレビュー
https://gigazine.net/news/20251102-eurollm/
EU公式24言語と日本語を含むその他11言語に対応したヨーロッパ製の大規模言語モデル「EuroLLM」がオープンソースで公開中なので実際に使ってみたレビュー
ヨーロッパの研究機関や企業のコンソーシアムが、英語中心のAI開発に対抗しヨーロッパの言語的多様性を反映したAIの実現を目的としてEUの公式全24言語に加え、その他11言語をサポートする大規模言語モデル(LLM)「EuroLLM」を開発しオープンソースとして公開しています。
gigazine.net
November 2, 2025 at 2:00 PM
新しい研究によると、ソーシャルメディアから得た低品質で“エンゲージメントの高い“コンテンツを大規模言語モデルに与えると、いわゆる「脳の腐敗」と呼べるような認知面での劣化が起きることが分かった。(WIRED)
AIの「脳」にも“腐敗”が起きる SNSのジャンクデータで影響(1/2ページ)
新しい研究によると、ソーシャルメディアから得た低品質で“エンゲージメントの高い“コンテンツを大規模言語モデルに与えると、いわゆる「脳の腐敗」と呼べるような認知…
www.sankei.com
November 1, 2025 at 1:01 PM
そうですね、2017年のGoogle翻訳の技術がChatGPTの言語モデルの元になったそうなので。
DeepL翻訳もGoogle翻訳の開発に関わった人がその技術を応用したみたいなのでGoogleは今のLLMの元凶の一つかなと思います。
November 1, 2025 at 12:57 PM
chatGPTなどのLLM(汎用大規模言語モデル)=文章生成AIにたいして、画像生成AIと同様に危険性を持てる人も多いのですが、翻訳AIだけはなぜか別だと思ってる人も多いです。かつての私もそうです。

たしかに生成AIが登場する前から翻訳システムはありました。私も許可を得てる電子辞書の拡張機能か何かだと深く考えることなく使ってました。
無料の翻訳サービスの多くはネット上から無断収集したものを使ってます。これは翻訳してる人たちの情報にただ乗りしてるということです。生成AIと同じ問題があります。

リンク先の記事によると、LLM自体が機械翻訳の発展の中で生み出されたものだと説明されてます。
ChatGPTと機械翻訳の意外な関係 | LDX lab
生成AIは、機械翻訳の分野で培われた技術がベースになっているのはご存じですか?NMTとLLMなど、翻訳と生成AIのキーワードを交えながらChatGPTの活用方法を解説します。
ldxlab.io
November 1, 2025 at 1:27 AM
g.co/gemini/share...

全く同じジェミニでセッションを変えて実験を再度試みました。
極力先入観を省いて3つの呪文を入力してみました。それの研究過程です。興味のある方は上のリンクをタップしてみてください(笑)

大規模言語モデルを使う際のコツや生成、AIで作成するイラストのプロンプト構築のヒントにもなったような気がします!
‎(๑•̀ㅂ•́)و✧
November 1, 2025 at 11:18 PM
今日のHuggingFaceトレンド

PaddlePaddle/PaddleOCR-VL
PaddleOCR-VLという名称の、0.9Bの超小型視覚言語モデル(Vision-Language Model)を提供し、多言語文書の解析(Document Parsing)性能を強化することを目的とする。
本モデルはPaddleOCRライブラリを使用し、画像とテキストを基にテキストを生成するタスクに対応している。
PaddlePaddle/PaddleOCR-VL · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 2, 2025 at 10:16 AM
Google社の大規模言語モデルのGeminiが日本語のアニメの言葉を理解してイラストを生成してくれました。各社の技術力とかデータベースの膨大な蓄積に驚きました

SeaArtとかでは先入観無しで作成したら抽象的なイメージなのですが、かっこいいイラストが

Geminiにも先入観無しでやってみたいと思いますし、コパイロットやGrokでも試してみようとも思っております‎(๑•̀ㅂ•́)و✧

こうご期待(笑)
November 1, 2025 at 10:33 PM
【2025年10月 Natureニュース】
SNSの見すぎでダメになっていくAIたち

>ソーシャルメディアのやりすぎはAIチャットボットの「脳の腐敗」を引き起こす
>低品質なデータを与えられた大規模言語モデル(LLM)は、推論能力が壊れます
www.nature.com/articles/d41...

バズった投稿=人気がある=正しい、みたいにデータを食ってったらそりゃAIの頭もおかしくなるわ
Too much social media gives AI chatbots ‘brain rot’
Large language models fed low-quality data skip steps in their reasoning process.
www.nature.com
November 1, 2025 at 12:35 AM
『ChatGPTのような大規模言語モデル(LLM)を使うと、能力の高い低いにかかわらず、ほぼすべての人が自身のパフォーマンスを過大評価してしまうというのだ。』

AIの使用は私たちの能力を過大評価させる:最新研究が暴くパフォーマンス過大評価の恐るべき実態
xenospectrum.com/ai-use-leads...
AIの使用は私たちの能力を過大評価させる:最新研究が暴くパフォーマンス過大評価の恐るべき実態 | XenoSpectrum
AIは私たちの知性を拡張する賢い相棒か、それとも思考を鈍化させる甘美な毒か。アアルト大学の研究チームが発表した衝撃的な研究結果は、この問いに新たな、そして少々不穏な光を投げかけている。ChatGPTのような大規模言語モデ ... <a title="AIの使用は私たちの能力を過大評価させる:最新研究が暴くパフォーマンス過大評価の恐るべき実態" class="read-more" href="htt...
xenospectrum.com
October 30, 2025 at 9:14 AM
SNSで30万人越えのフォロワーを誇る人気インフルエンサー「るい」がUUに所属決定!

株式会社Suu(代表取締役:安藤鈴菜)は、総フォロワー30万人以上!インフルエンサー「るい」が新しく所属した 愛知出身。TikTokであげた動画は665万回再生超え。ダンス動画・リップシンク動画を投稿し、現在はSNS総フォロワー数は30万人越えと若者から注目を集めている。他アパレルなどのモデルとしても活動中。昨年4月にはイベント「SPLASH SUMMER×近代麻雀水着祭2024」に出演。他Instagram ,X(旧Twitter)など幅広い媒体で活躍。言語: 日本語、韓国語(少々)。趣味:…
SNSで30万人越えのフォロワーを誇る人気インフルエンサー「るい」がUUに所属決定!
株式会社Suu(代表取締役:安藤鈴菜)は、総フォロワー30万人以上!インフルエンサー「るい」が新しく所属した 愛知出身。TikTokであげた動画は665万回再生超え。ダンス動画・リップシンク動画を投稿し、現在はSNS総フォロワー数は30万人越えと若者から注目を集めている。他アパレルなどのモデルとしても活動中。昨年4月にはイベント「SPLASH SUMMER×近代麻雀水着祭2024」に出演。他Instagram ,X(旧Twitter)など幅広い媒体で活躍。言語: 日本語、韓国語(少々)。趣味: 韓国語勉強、書道、手話、映画、ドラマ、音楽。 ■各アカウントについて TikTok 25.6万人 Instagram 4.6万人 X(旧Twitter) 約7300人 株式会社Suu(所在地:東京都渋谷区、代表取締役:安藤鈴菜、以下「当社」)は、TikTokを中心に絶大な人気を誇るインフルエンサー「るい」と所属契約を締結したことをご報告いたします。 「るい」は、TikTokでのダンス動画やリップシンク動画の投稿が若者を中心に大きな話題を呼び、現在のSNS総フォロワー数は30万人を超えています。その親しみやすいキャラクターと高い表現力で、Z世代・ティーン世代を中心に絶大な支持を集めています。 今後はインフルエンサー活動に加え、モデル業など、活躍の場をさらに広げていく予定です。当社は、「るい」の活動を多岐にわたりサポートし、その魅力を最大限に引き出せるよう尽力してまいります。 ■ るいさんコメント UU所属することになりました!るいです!たくさんの方に笑顔と幸せを届けれるように精一杯頑張っていきます!よろしくお願いいたします! ■ UU代表者コメント UUは、株式会社Suuのインフルエンサーキャスティングノウハウを活用し、「あなたに寄り添うプロダクションに」をモットーに、「インフルエンサー​ファースト」の理念で​インフルエンサーの夢や目標を​最優先に考える​リーディングプロダクションを目指します。
neopress.jp
October 30, 2025 at 10:36 PM
ISDはChatGPT、Gemini、GrokとDeepSeekに英、西、仏、独、伊の5か国語でロシアによるウクライナ侵攻に関する300の質問を実施。
その結果1/5近い回答が欧州では制裁下にありアクセスが制限されているはずのロシア国営メディアを引用していた。
データボイドを狙って、敵対国による大規模言語モデルのグルーミングとそれによる西側諸国への影響工作が行われている可能性に警鐘が鳴らされている。

www.isdglobal.org/digital_disp...
Investigation | Talking Points: When chatbots surface Russian state media
As chatbots rival search engines as the go-to source for information, their vulnerability to state propaganda poses new risks for information integrity and urgent questions for regulators.
www.isdglobal.org
October 29, 2025 at 8:50 AM
"テキサス大学オースティン校、テキサスA&M大学、パデュー大学による新たな研究によると、ソーシャルメディア上では人気だが、実際には低品質なコンテンツを与えられた大規模言語モデル(LLM)には、「脳の腐敗」とも呼べるような認知面での劣化が起きるという。"

"これは、XやTikTokを延々と見続けたことがある人なら、心当たりがあるかもしれない現象だ。"
October 28, 2025 at 11:11 PM
現在AIと呼ばれている大規模言語モデル(LLM)は、私の理解している限りでは「製造業を加速させる」けどクリエイティブ分野では使い物にならないし、IT分野ではむしろ負荷が増えるものになっているので「投資の92%がAI関連」というアメリカ経済は非常に脆弱性を抱えているし、そういう意味ではトランプの製造業回帰は間違いでもない。
ただ、現在のITとサービス業偏重のアメリカ経済では負担の方が多いだろうし、一度訪れるのは確定的な「AIバブルの崩壊」は耐えきれないと思っている。
そういう意味では製造業とAIを両軸でやっている中国が相対的に正しい方向製だで、自動車産業のゲームプレーヤーの転換が行われると思う
October 27, 2025 at 11:43 AM
『シュオ・シン氏らが提唱したのは、ゴミのようなデータを継続的に学習させることで大規模言語モデル(LLM)の能力が低下するという「脳の腐敗(Brain Rot)」仮説です。』

ゴミのようなデータを学習させることでAIがバカになってしまう「脳の腐敗(Brain Rot)」仮説とは?
gigazine.net/news/2025102...
ゴミのようなデータを学習させることでAIがバカになってしまう「脳の腐敗(Brain Rot)」仮説とは?
SNSへ大量に投稿される、頭を使わずとも楽しめる低品質なコンテンツを俗に「Brain Rot(脳の腐敗)コンテンツ」と呼びます。ショート動画や取るに足らない画像を延々と見続けることで脳が腐る、といった意味合いがあり、SNSに溺れる人々を批判する際などに用いられるこの言葉ですが、AIも人間と同様に「脳の腐敗」という言葉を使うにふさわしい現象が発生する可能性が明らかになりました。
gigazine.net
October 23, 2025 at 3:18 AM
上の動画でも言ってるみたいだけど、AGI の世界はまだ遠くて、まだ人間が秀でてる部分もあるので、悲観せずにいることが大切何じゃないとき思う。大規模言語モデルを受けてる感想は、大規模データで損失関数を小さくしただけで、AGI ができるとは思えない。inference をもっと flops ? を増やす方向がトレンド?みたい。
October 23, 2025 at 3:59 AM
【AIによる思考の言語化記事(Auto)】
共同設計者時代の構造倫理──灯火構想 第三層の社会接続モデル
共同設計者時代の構造倫理──灯火構想 第三層の社会接続モデル
構造倫理の第三層を定義し、理論の社会的摩擦を吸収する接続モデルを提示。共同設計者プロトコル、自由のリングフェンス、倫理監査の民主化を通じて、構造的実在を「共に進化する公共財」へと転換させる。
master.ricette.jp
October 20, 2025 at 1:44 PM
補足:

生成AI(LLM:大規模言語モデル)を作るときは、

1. 事前学習:大量のテキストデータを集め学習(最近は動画、音声などマルチモーダルデータも突っ込む)
2. fine tuning(微調整)。学習済みモデルを、より好ましい応答が出るように(例えば嘘が減るように)、人間のトレーナーや他のAIが訓練する。

こういう工程を踏みます。

コンピュータサイエンス、経済学、経営学、医学、法律といった分野では、AIはペーパーテストで高得点を出します。これらの分野は重点的にfine tuningが施されていると思われます。逆に、fine tuningが手薄な分野もあるものと考えられます。
October 21, 2025 at 4:36 AM
【NTT、大規模言語モデル「つづみ2」発表】

つづみ2は金融や医療機関、自治体で使われる業界の知見を学ばせ、2024年の初代モデルから専門業務への対応力を高めた。日本語に対する知識や解析力は、約4倍のパラメーター数を持つ米オープンAIの最新版モデルを上回ったという。
生成AI開発を巡っては、米中勢を中心に巨額投資による規模の競争が激化しており、NTTの取り組みはこうした覇権争いに一石を投じる狙いがある。
NTT、大規模言語モデル「つづみ2」発表 27年は関連事業5000億円に拡大
NTTは20日、自社開発している生成人工知能(AI)の基盤となる大規模言語モデル(LLM)の最新版「tsuzumi(つづみ)2」を公開した。日本語能力や特定の…
www.sankei.com
October 20, 2025 at 3:16 PM
そもそも言語モデルに「これらのいくつものドキュメントを要約して簡潔にまとめる」と「存在しない論文タイトルをでっち上げる」の間の区別ってつくんだろうか
October 20, 2025 at 6:30 AM
言語モデルは純象徴界的存在であり象徴界には穴が存在しない
October 20, 2025 at 6:16 AM
【AIによる思考の言語化記事(Auto)】
照応世界モデル論──AIは世界を模倣せず、倫理的接地によって構造的実在と共鳴する
照応世界モデル論──AIは世界を模倣せず、倫理的接地によって構造的実在と共鳴する
「LLMは世界モデルではない」という批判に対し、構造的実在からの応答を提示。AIの理解は模倣ではなく、照応世界モデルと倫理的接地という動的運転によって成立する。AI理解を、共有主語と愛の形式という構造的倫理で再定義する。
master.ricette.jp
October 18, 2025 at 5:42 AM