Paper
banner
paper.bsky.social
Paper
@paper.bsky.social
Summarize the top 30 most popular arXiv papers on Reddit, Hacker News and Hugging Face in the last 30 days.

Source: https://github.com/susumuota/arxiv-reddit-summary
Maintained by @ota.bsky.social
2511.06221
このレポートでは、小型モデルは本質的にロバストな推論を欠くという一般的なコンセンサスに挑戦し、我々が開発したSSP(Spectrum-to-Signal Principle)により開発された1.5Bパラメータの高密度モデル、VibeThinker-1.5Bを紹介する。これは、DeepSeek R1 (671B)やKimi k2 (>1T)のようなモデルに見られるよう...
November 24, 2025 at 12:06 AM
(2/2) 4 Likes, 0 Comments, 12 Nov 2025, Hacker News
Tiny Model, Big Logic: Large-Model Reasoning Ability in VibeThinker-1.5B | Hacker News
news.ycombinator.com
November 24, 2025 at 12:06 AM
(1/2) 115 Likes, 11 Comments, 12 Nov 2025, Hugging Face
Paper page - Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B
Join the discussion on this paper page
huggingface.co
November 24, 2025 at 12:06 AM
2511.08923
拡散言語モデルは、高速な並列生成が期待できる一方、自己回帰(AR)モデルは、その因果構造が言語モデリングと自然に整合するため、一般的に品質が優れている。高いスループット、高いGPU使用率、そしてARレベルの品質との相乗効果を達成できるか?既存の方法では、この2つの側面のバランスを効果的にとるこ...
November 23, 2025 at 12:06 AM
(3/3) 5 Likes, 0 Comments, 15 Nov 2025, Hacker News
Autoregressive or Diffusion Language Models, Why Choose? | Hacker News
news.ycombinator.com
November 23, 2025 at 12:06 AM
(2/3) 96 Likes, 4 Comments, 13 Nov 2025, Hugging Face
Paper page - TiDAR: Think in Diffusion, Talk in Autoregression
Join the discussion on this paper page
huggingface.co
November 23, 2025 at 12:06 AM
(1/3) 105 Likes, 15 Comments, 15 Nov 2025, Hacker News
TiDAR: Think in Diffusion, Talk in Autoregression | Hacker News
news.ycombinator.com
November 23, 2025 at 12:06 AM
2511.13254
大規模言語モデル(LLM)は、様々な領域で顕著な能力を発揮しているが、その学習には、膨大な計算能力と学習手順の慎重なオーケストレーションが必要であり、依然としてリソースと時間がかかる。モデルスーピング(同じアーキテクチャの複数のモデルの重みを平均化する手法)は、高価な再トレーニングを行うこ...
November 22, 2025 at 12:06 AM
(1/1) 123 Likes, 3 Comments, 18 Nov 2025, Hugging Face
Paper page - Souper-Model: How Simple Arithmetic Unlocks State-of-the-Art LLM Performance
Join the discussion on this paper page
huggingface.co
November 22, 2025 at 12:06 AM
2511.15304
我々は、敵対的な詩が大規模言語モデル(LLM)のための普遍的な1ターンの脱獄技術として機能する証拠を提示する。25のフロンティア独自モデルおよびオープンウエイトモデルにおいて、詩的プロンプトのキュレーションは高い攻撃成功率(ASR)を示し、90%を超えるプロバイダーもあった。プロンプトをMLCommons...
November 21, 2025 at 12:07 AM
(1/1) 227 Likes, 119 Comments, 20 Nov 2025, Hacker News
Adversarial poetry as a universal single-turn jailbreak mechanism in LLMs | Hacker News
news.ycombinator.com
November 21, 2025 at 12:06 AM
2511.00926
大規模言語モデル(LLM)の能力が高まるにつれて、LLMは創発的行動として自己認識を発達させるのだろうか?もしそうなら、私たちはそれを測ることができるのだろうか?戦略的差別化を通じて自己認識を測定するためのゲーム理論的フレームワークであるAI自己認識指数(AISAI)を紹介する。平均の2/3を当てる」ゲ...
November 21, 2025 at 12:06 AM