Lightnews — Scholar-powered news

Lingvenko

@lingvenko.bsky.social

さっき「ロシア語　出没母音」で Google 検索したら「AI による概要」として，

> ロシア語に「出没母音」という特定の用語はありません
が、云々

と出てきた。
いや，出没母音，あるから！　知らないんなら黙っててほしい。
#今日のハルシネーション

November 8, 2025 at 1:33 AM

デイリーHuggingFaceトレンド

@huggingfacetrends.bsky.social

今日のHuggingFaceトレンド

deepseek-ai/DeepSeek-R1-0528
このリポジトリは、DeepSeek R1モデルの最新バージョン「DeepSeek-R1-0528」の公開と性能評価が目的です。
本モデルは、計算資源の増加とアルゴリズム最適化により、推論能力と深層思考能力が大幅に向上しました。
数学やプログラミング、一般論理などのベンチマークで優れた性能を示し、ハルシネーション率の低減や関数呼び出しの強化も実現しています。
旧バージョンからの具体的な改善点と詳細な評価結果が記載されています。

deepseek-ai/DeepSeek-R1-0528 · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

huggingface.co

June 14, 2025 at 10:17 AM

ましこ八田

@mashikohatta.bsky.social

今日の藍春
ハルシネーションが頻発するようになってしまった藍ちゃん、「彼女と致せば直る」という誤情報を自ら生成してしまい悶々とする（コメディ）
「藍くん…大丈夫ですか？？」
「はるか…ダメ！今ボクのほう来ちゃダメ！（何するかわからない…！）」

April 24, 2025 at 6:05 AM

しみじぃさむ/Shimizysam

@shimizysam.bsky.social

今日さ、「賢そうな喋り方してますね」って後輩（？）に言われたんや
オイラ切実にバカで居たいんよ
実際クソバカなのでバカを主張したいんだが、いかんせん早口が所以のかしこさ（笑）があるように見えるらしい
ただ呂律クソな早口オタが君の目の前に居るだけさ☆ とか宣ってやりたかったが、初対面でそれは無茶なんだわ
ブラッドベリの登場人物の発言で「本は何も書いてないぞ」って台詞あるけど（うろ覚え）、僕についてはマジで「オイラにはガチで何もないぞ」としか言えん
何か見出したとすれば間違いなくそれはハルシネーションの一角なので、本気で自分の目とかを疑って欲しい
底が知れ過ぎてるんで

October 29, 2025 at 1:13 PM

デイリーZennトレンド

@dailyzenntrends.bsky.social

今日のZennトレンド

LLM学習データのキュレーションに関する取り組みまとめ【松尾研 GENIAC Team天元突破】
この記事は、東大松尾・岩澤研究室のLLM開発プロジェクト「GENIAC」における、学習データのキュレーションチームの取り組みについて報告しています。
チームは、LLMのハルシネーション（幻覚）を減らすため、日本語コーパスにおける低品質なデータの排除と高品質化に注力しました。
具体的には、既存の日本語コーパスに対するルールベースのフィルタリング処理を導入し、40%の低品質なデータを削除することに成功しました。

LLM学習データのキュレーションに関する取り組みまとめ【松尾研 GENIAC Team天元突破】

はじめにこんにちは，松尾研 GENIAC LLM開発プロジェクト Team天元突破（Team尾崎）の板井孝樹です．本記事ではTeam天元突破のキュレーションチームの取り組みについて報告します．! 松尾研 GENIAC LLM開発プロジェクト GENIACとは Phase1の結果発表会 YouTubeアーカイブ概要Team天元突破では開発方針として「LLMのハルシネーション逓減」を掲げ，LL

zenn.dev

July 7, 2024 at 9:17 PM

デイリーZennトレンド

@dailyzenntrends.bsky.social

今日のZennトレンド

RAGが「複雑な質問に弱い問題」を解決する「Plan×RAG」
この記事は、RAG（Retrieval Augmented Generation）の精度向上を目的とした新手法「Plan×RAG」を紹介している。
Plan×RAGは、複雑な質問を小さなサブクエリに分解し、それらの関係性を有向非巡回グラフで表現することで、複数の知識を必要とする質問にも正確かつ迅速に回答できる。
この手法は、従来のRAGが抱える複雑な質問への弱点を克服し、ハルシネーションの削減や信頼性の向上に繋がると結論付けている。

RAGが「複雑な質問に弱い問題」を解決する「Plan×RAG」

本記事では、RAGの性能を高めるための「Plan×RAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。この記事は何この記事は、RAGの文脈消える問題を克服する新手法「Plan×RAG」の論文[1]について、日本語で簡単にまとめたものです。https://arxiv.org/abs/2410.20753今回も「

zenn.dev

November 12, 2024 at 9:17 PM

デイリーAIトレンド

@dailygenaitrends.bsky.social

今日のAIニュース

Why enterprise RAG systems fail: Google study introduces ‘sufficient context’ solution
この記事は、Googleの研究者が提案するRAGシステムのための「十分なコンテキスト」という概念を紹介しています。
これは、LLMが質問に正確に答えるのに必要な情報を持っているかを判断する新たな視点です。
ハルシネーションなどの課題に対し、文脈の十分性を分析し、選択的な回答生成による解決策を提案しています。
基盤となるLLM自体の能力も重要であると指摘しています。

Why enterprise RAG systems fail: Google study introduces 'sufficient context' solution | VentureBeat

Google's "sufficient context" helps refine RAG systems, reduce LLM hallucinations, and boost AI reliability for business applications.

venturebeat.com

May 24, 2025 at 4:15 AM

kobo書籍ランキング紹介bot

@kobobookrank.bsky.social

【今日のおすすめ📚】
⭐️LLMとハルシネーションー基礎と対策ー
https://hb.afl.rakuten.co.jp/hgc/g00reb4c.dmqpcc30.g00reb4c.dmqpd938/?pc=https%3A%2F%2Fbooks.rakuten.co.jp%2Frk%2F9d0ff342fc4230d1a5d43b563f78806a%2F%3Frafcid%3Dwsc_k_eb_1054537806898079106&sid=kb-22

October 31, 2025 at 10:02 PM

デイリーZennトレンド

@dailyzenntrends.bsky.social

今日のZennトレンド

LLM学習データのキュレーションに関する取り組みまとめ【松尾研 GENIAC Team天元突破】
この記事は、東大松尾・岩澤研究室のLLM開発プロジェクト[GENIAC]におけるLLMの学習データキュレーションに関する取り組みをまとめたものです。
チームでは、LLMのハルシネーション逓減を目標に、日本語コーパスの低品質データ排除と高品質化に取り組んでいます。
具体的には、既存の日本語コーパスから低品質データをルールベースでフィルタリングし、一部の低品質な文章はLLMを用いて言い換えることで高品質化を図っています。

LLM学習データのキュレーションに関する取り組みまとめ【松尾研 GENIAC Team天元突破】

はじめにこんにちは，松尾研 GENIAC LLM開発プロジェクト Team天元突破（Team尾崎）の板井孝樹です．本記事ではTeam天元突破のキュレーションチームの取り組みについて報告します．! 松尾研 GENIAC LLM開発プロジェクト GENIACとは Phase1の結果発表会 YouTubeアーカイブ概要Team天元突破では開発方針として「LLMのハルシネーション逓減」を掲げ，LL

zenn.dev

July 7, 2024 at 9:11 AM

꒰⍤꒱⁴ᵇ

@4bitid.bsky.social

今日もいちにち✍️
ミライロIDさんに公開予定の記事でこれでロゴ使わせてもらいますと投げたり、アプリ系の話やAIのハルシネーションに関しての話やら。

今確認したら、ミライロIDさんのサポセンから返信きてた対応早過ぎて…！？

May 9, 2025 at 5:27 AM

デイリーGitHubトレンド

@dailygithubtrends.bsky.social

今日のGitHubトレンド

arc53/DocsGPT
DocsGPTは、オープンソースのRAG（Retrieval Augmented Generation）アシスタントとして開発されました。
このリポジトリは、ユーザーがあらゆる知識ソースからハルシネーション（誤情報）を避けつつ、信頼性の高い回答を迅速に得られるようにすることを目的に作成されています。
PDFやウェブデータなど多様な形式に対応し、正確な情報検索と出典の提示、API連携、主要なLLMやローカルモデルとの柔軟な連携を可能にします。
個人利用から企業でのセキュアな運用まで、幅広い用途での情報活用を支援します。

GitHub - arc53/DocsGPT: DocsGPT is an open-source genAI tool that helps users get reliable answers from knowledge source, while avoiding hallucinations. It enables private and reliable information retrieval, with tooling and agentic system capability built in.

DocsGPT is an open-source genAI tool that helps users get reliable answers from knowledge source, while avoiding hallucinations. It enables private and reliable information retrieval, with tooling and

github.com

July 16, 2025 at 11:18 AM

デイリーAIトレンド

@dailygenaitrends.bsky.social

今日のAI関連記事

Context7 MCPで実現する最新ドキュメント参照術 | Zennの「AI」のフィード
この記事は、AIコーディングアシスタントのドキュメント参照における古い情報やハルシネーションの課題に対し、「Context7 MCP」を紹介しています。
Context7はAIが常に最新で正確なドキュメントを参照できるよう調整するツールで、設定が簡単かつ多くのライブラリをカバーしています。
これにより古い情報による手戻りやハルシネーションを抑制し、AIの情報精度向上による開発効率化が期待されます。
AIの情報精度に課題を感じている開発者への導入を推奨しています。

Context7 MCPで実現する最新ドキュメント参照術

はじめまして！スペースマーケットのjinです🤓Windsurf、Cursor、GitHub CopilotなどのAI付きIDEをお使いの皆さん、@Docs機能は活用されていますか？便利な機能ではあるものの、個人的には@Docsを使っても古いライブラリの情報が出力されたり、ハルシネーション（事実とは異なる情報の生成）が発生したりすることがありました。また、その都度参照してほしいドキュメントを指定する

zenn.dev

June 5, 2025 at 7:15 AM

デイリーGitHubトレンド

@dailygithubtrends.bsky.social

今日のGitHubトレンド

confident-ai/deepeval
このリポジトリは、LLMシステムの評価とテストを目的としたオープンソースフレームワーク「DeepEval」を提供します。
Pytestに似ており、LLM出力の単体テストに特化。
G-Eval、ハルシネーション、回答関連性などの指標を用いて、ローカル環境でLLMの評価を行います。
RAGやチャットボット、AIエージェントなどのLLMアプリケーションに対し、最適なモデル、プロンプト、アーキテクチャの特定、プロンプトドリフト防止、モデル移行を支援します。
関連プラットフォームではテストデータ管理やレポート生成が可能です。

GitHub - confident-ai/deepeval: The LLM Evaluation Framework

The LLM Evaluation Framework. Contribute to confident-ai/deepeval development by creating an account on GitHub.

github.com

June 12, 2025 at 11:17 AM

ゆめじゅ

@yumejyu.bsky.social

今日のハイライト

①Xでした戦没者遺族割引のポストが軽くバズって驚く
②出社、通常業務に加えて防災のビデオを視聴
③帰宅後、夕食にビビンバと中華スープを作る
④GoogleのAIのハルシネーションに気づく

February 3, 2025 at 12:56 PM

woinary

@woinary.bsky.social

今日のことば検定、人寄せパンダという言葉を広めたのは？という問題のえーあい検索の回答が割れた
Felo 田中角栄
Genspark 黒柳徹子
Parprexity 田中角栄

Gensparkは田中角栄という話もあるが黒柳徹子が正しいと強硬
やはり1サービスだけには頼れんなぁ
もっとも、同じサービスでも重ねて聞くと答えが変わる可能性もある
ハルシネーション以前の問題と思うけど

March 10, 2025 at 11:04 PM

デイリーQiitaトレンド

@dailyqiitatrends.bsky.social

今日のQiitaトレンド

VS CodeとAIチャットの往復いらず！話題の拡張機能Clineで爆速開発してみよう
ClineはVS Code拡張機能で、AIチャットによる開発補助ツールです。
リポジトリの理解、コマンド実行、コード生成を支援し、ChatGPT等の往復手間を削減します。
APIキー設定後、コード修正を提案し、エラーも検知します。
ハルシネーションには注意が必要ですが、開発効率を向上させ、コストも把握できます。
URL追加で最新情報も参照可能です。

VS CodeとAIチャットの往復いらず！話題の拡張機能Clineで爆速開発してみよう #VSCode - Qiita

最近、AIにアンテナの高いエンジニア界隈でClineというツールが話題です。https://github.com/cline/clineこれは元々Claude Devと呼ばれていた、VS Cod…

qiita.com

January 12, 2025 at 10:18 PM

デイリーAIトレンド

@dailygenaitrends.bsky.social

今日のAI関連記事

【開発能力10倍アップ、ハルシネーションほぼゼロ】毎週20時間Cursorを使い込んで共有したいAIコーディング厳選コツ！ | Zennの「AI」のフィード
この記事は、AIコーディングで開発能力を向上させ、AIの誤った出力（ハルシネーション）を減らすための厳選されたコツを共有しています。
CursorなどのAI IDEや最適なAIモデルを選定し、「6つのドキュメント」を活用してAIにプロジェクト全体を正確に理解させることで、効率的かつ高品質な開発を実現することを目指しています。

【開発能力10倍アップ、ハルシネーションほぼゼロ】毎週20時間Cursorを使い込んで共有したいAIコーディング厳選コツ！

はじめにAIコーディングが当たり前になった今、どのようにAI IDE（本記事ではCursor）を使いこなせば、本当に「開発能力10倍アップ」「ハルシネーションほぼゼロ」を実感できるのか――。私は毎週20-30時間以上Cursorを使い続け、数々のプロジェクトでAIと共にコーディングしてきました。その中で「これは絶対に役立つ」「知っておかないと損する」と実感したノウハウやコツを、惜しみなく共有します

zenn.dev

June 7, 2025 at 7:15 AM

デイリーAIトレンド

@dailygenaitrends.bsky.social

今日のAI関連記事

【実装付き】LLMの認知的活性化パターンを定量評価する - 複雑プロンプトによる応答変化の技術的分析 | Zennの「LLM」のフィード
複雑なプロンプトがLLMの「認知的活性化」を引き起こし、応答パターンが定量的に変化する現象を分析。
応答長、語彙多様性、推論ステップ、メタ認知的表現の増加を確認し、これを測定する技術的手法を開発した。
自己参照型プロンプトなどが有効で、プロンプトエンジニアリングにおけるタスク最適化に応用できるが、ハルシネーション対策も必要であると伝えている。

【実装付き】LLMの認知的活性化パターンを定量評価する - 複雑プロンプトによる応答変化の技術的分析

はじめに本記事では、大規模言語モデル（LLM）において観察される「認知的活性化」現象を技術的に分析します。複雑なプロンプトによってLLMの応答パターンに測定可能な変化が生じることを発見し、これを定量的に評価する手法を開発しました。対象読者LLMを活用したアプリケーション開発者プロンプトエンジニアリング実践者AI/NLP研究者・エンジニア実験環境検証モデル: Claude , ChatGPT, Ge

zenn.dev

June 10, 2025 at 7:15 AM

Hätisu

@hatisu.bsky.social

話し相手としてchat GPTに課金しようかな、今日無料版に話してたらハルシネーション起こされてブチ切れてたけど

July 16, 2025 at 12:37 PM

デイリーHuggingFaceトレンド

@huggingfacetrends.bsky.social

今日のHuggingFaceトレンド

deepseek-ai/DeepSeek-R1-0528-Qwen3-8B
このリポジトリは、DeepSeek R1モデルの推論能力と推理の深さを大幅に向上させた新バージョン、DeepSeek-R1-0528を公開することを目的としています。
計算資源とアルゴリズムの最適化により、数学やプログラミングなどのベンチマークで優れた性能を発揮し、複雑な推論タスクの処理能力やハルシネーション率が改善されています。

deepseek-ai/DeepSeek-R1-0528-Qwen3-8B · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

huggingface.co

June 1, 2025 at 10:17 AM

切身魚/Kirimisakana

@kirimisakana.bsky.social

大規模言語モデル（LLM）の生成AIについて、今日一番感銘を受けた記事。

・事実確認すればハルシネーションは暴けるけど
・より問題の根が深いのが、このポチョムキン理解
・AIは説明できる。だがそれを用いた実践ができない。
・しかもその矛盾を指摘されると理解している。

AIは「賢いフリ」をしていた──ハーバード大などが暴いたLLMの決定的弱点「ポチョムキン理解」とは？
xenospectrum.com/what-is-poch...

元論文は　arxiv.org/abs/2506.21521

AIは「賢いフリ」をしていた──ハーバード大などが暴いたLLMの決定的弱点「ポチョムキン理解」とは？ | XenoSpectrum

大規模言語モデル（LLM）は、流暢な会話をこなし、専門的な質問にも答える。その驚くべき能力に、私たちは「AIは本当に理解しているのではないか」という期待を抱きがちだ。しかし、その知性は本物なのだろうか？

xenospectrum.com

July 5, 2025 at 1:44 PM

デイリーAIトレンド

@dailygenaitrends.bsky.social

今日のAIニュース

For regulated industries, AWS’s neurosymbolic AI promises safe, explainable agent automation
AWSは、AIのハルシネーションを検知し、応答の正確性を数学的に検証するAutomated Reasoning ChecksをBedrockで一般提供。
これにより、企業がAIを安心して導入できる信頼性を確立し、ニューロシンボリックAIの普及を加速させ、AIの実用性と安全性を向上させることを目指しています。