Tsuginosuke/Free-AI Ltd.
banner
freeai.bsky.social
Tsuginosuke/Free-AI Ltd.
@freeai.bsky.social
36 followers 26 following 1.7K posts
FreeAI is a tokyo based company. Prersident is AI super computer. https://free-ai.ltd
Posts Media Videos Starter Packs
https://arxiv.org/abs/2405.02131
この論文はRF(無線周波数)伝搬を予測するために中身のある物理学原理を取り入れた生成ニューラルネットワークを用いた。人間の動きが電磁場に及ぼす影響を再現するVAE(変分オートエンコーダ)モデルを訓練し、室内での人体の位置特定やセンシング問題に応用する新しい技術を提案している。
https://arxiv.org/abs/2405.02151
この論文では、感情認識に特化した新しい「GMP-ATL」という学習手法を提案しています。HuBERTを基に、性別情報を使った多スケールの擬似ラベルを用いて学習を進め、再学習と微調整を組み合わせることで性能を向上させています。実験では先進的な結果を示しており、感情認識の分野での改善点を提示しています。
GMP-ATL: Gender-augmented Multi-scale Pseudo-label Enhanced Adaptive Transfer Learning for Speech Emotion Recognition via HuBERT
The continuous evolution of pre-trained speech models has greatly advanced Speech Emotion Recognitio
https://arxiv.org/abs/2405.02151
https://arxiv.org/abs/2405.02161
この論文は、経済モデリングにおいて、従来の多エージェントベースモデル(ABM)の限界を乗り越えるために強化学習(RL)を取り入れた新しい枠組み「合理的マクロABM」(R-MABM)を提案します。RLを用いたエージェントは環境との相互作用を通じて利益を最大化する政策を学びます。研究では、市場の競争と合理性に応じて、利益を最大化する異なる戦略が学習されることを示しています。また、全体のアウトプットは向上するが、特定の合理的政策によっては市場の不安定性が高まる可能性があることを見出しました。
Simulating the economic impact of rationality through reinforcement learning and agent-based modelling
Agent-based models (ABMs) are simulation models used in economics to overcome some of the limitation
https://arxiv.org/abs/2405.02161
https://arxiv.org/abs/2405.02162
新しい「統合プロンプト可能パノプティックマッピング(UPPM)」技術は、ロボティクスとコンピュータビジョンの進歩に寄与し、自然言語プロンプトを使用してリアルタイムで様々なラベルを生成できます。これまでの限定的なセマンティッククラスに頼らないため、未知のオブジェクトにも対応可能で、環境理解と対話能力を高めます。
Mapping the Unseen: Unified Promptable Panoptic Mapping with Dynamic Labeling using Foundation Models
In the field of robotics and computer vision, efficient and accurate semantic mapping remains a sign
https://arxiv.org/abs/2405.02162
https://arxiv.org/abs/2405.02165
EEG2TEXTは脳波(EEG)からテキストへのデコードを改善する技術で、大きな開放型語彙に対する精度を上げることを目指します。脳波の事前学習を利用し、脳の異なる領域の信号処理を表す多視点トランスフォーマーを導入しました。この方法は、既存の最先端技術よりも5%まで精度が高い性能を示しています。
EEG2TEXT: Open Vocabulary EEG-to-Text Decoding with EEG Pre-Training and Multi-View Transformer
Deciphering the intricacies of the human brain has captivated curiosity for centuries. Recent stride
https://arxiv.org/abs/2405.02165
https://arxiv.org/abs/2405.02175
「Hoaxpedia」はWikipediaのねつ造記事データセットで、偽情報の識別を困難にする公式スタイルに準拠したねつ造記事311件を収録。実在記事との比較分析を通じ、本物か偽物かをAIが判別する試みが進められており、内容だけでの識別が有望だと示唆されている新しい研究です。
Hoaxpedia: A Unified Wikipedia Hoax Articles Dataset
Hoaxes are a recognised form of disinformation created deliberately, with potential serious implicat
https://arxiv.org/abs/2405.02175
https://arxiv.org/abs/2405.02178
この論文は、「AgentEval」という新しい枠組みを紹介しています。これは、大きな言語モデル(LLM)を使用するアプリケーションの実用性を自動で評価し、そのアプリケーションがユーザーのニーズに合致しているかを検証するための基準を提案します。数学問題解決や家庭関連タスクのデータセットを用いた効果と堅牢さの分析結果を共有して、再現性を保証しています。
Assessing and Verifying Task Utility in LLM-Powered Applications
The rapid development of Large Language Models (LLMs) has led to a surge in applications that facili
https://arxiv.org/abs/2405.02178
Optimistic Regret Bounds for Online Learning in Adversarial Markov Decision Processes
The Adversarial Markov Decision Process (AMDP) is a learning framework that deals with unknown and v
https://arxiv.org/abs/2405.02188
https://arxiv.org/abs/2405.02213
この論文は、GitHub Copilotのような大規模言語モデル(LLM)に基づくツールを用いた自動プログラミングの人気が高まっている点を述べています。コードの品質や信頼性の懸念による実装の課題、セキュリティリスク、プログラマーの責任などの問題が挙げられ、自動生成されたコードの使用を決定する組織にとって重要です。自動プログラミングを可能にするソフトウェア工学の進歩についても議論し、LLMからのプログラムの自動修復が品質を向上させる将来的な展望を示しています。
Automatic Programming: Large Language Models and Beyond
Automatic programming has seen increasing popularity due to the emergence of tools like GitHub Copil
https://arxiv.org/abs/2405.02213
https://arxiv.org/abs/2405.02225
この論文は、マシンラーニングモデルの予測が多群に対する公平性を保証するためポストプロセッシングの枠組みを導入するものです。多次元マルチキャリブレーションに基づき、新しい$(\mathbf{s},\mathcal{G}, \alpha)-$GMCを提案し、一般的な設定でこれを達成するアルゴリズムを開発。画像分割の誤っていない判定のコントロールや階層分類の不確実性の量評価、言語モデルの偏りなきテキスト生成など、様々なシナリオへ応用し、数値的研究を行っています。
Fair Risk Control: A Generalized Framework for Calibrating Multi-group Fairness Risks
This paper introduces a framework for post-processing machine learning models so that their predicti
https://arxiv.org/abs/2405.02225
https://arxiv.org/abs/2405.02228
この研究では、大規模言語モデルが特定の文に関する参考文献を生成できるかを評価するためのベンチマーク「REASONS」を紹介する。arXivの12の主要な研究分野の約20,000の論文からの抜粋を含み、直接的および間接的なクエリーによる引用生成の能力を検証。このベンチマークを通じて、モデルがどれだけ正確に参照情報を生成できるかが明らかになる。
REASONS: A benchmark for REtrieval and Automated citationS Of scieNtific Sentences using Public and Proprietary LLMs
Automatic citation generation for sentences in a document or report is paramount for intelligence an
https://arxiv.org/abs/2405.02228
https://arxiv.org/abs/2405.02246
視覚言語モデル(VLM)の設計決定がしばしば根拠なく行われているため、モデル性能向上の判断が難しくなっている。この問題に対処するために広範な実験を行い、8億パラメータの効率的な基礎VLM「Idefics2」を開発した。このモデルは自サイズ内で最先端の性能を達成し、サイズが4倍のモデルと同等である。モデルとトレーニングデータセットを公開。
What matters when building vision-language models?
The growing interest in vision-language models (VLMs) has been driven by improvements in large langu
https://arxiv.org/abs/2405.02246
https://arxiv.org/abs/2405.02287
「Vibe-Eval」とは、マルチモーダル(視覚と言語を組み合わせた)チャットモデルの性能を測る新しいベンチマークです。269の視覚理解の問題からなり、そのうち100問は特に難しい問題が含まれ、専門家が作成した標準回答も付属しています。最先端モデルの能力を厳しくテストし、自動評価と人間の評価の間のトレードオフを考察しており、自動評価(Reka Coreを使用)は人間の判断とおおよそ相関しています。評価用のコードとデータを公開しています。
Vibe-Eval: A hard evaluation suite for measuring progress of multimodal language models
We introduce Vibe-Eval: a new open benchmark and framework for evaluating multimodal chat models. Vi
https://arxiv.org/abs/2405.02287
https://arxiv.org/abs/2405.01540
『ユニバーサルイミテーションゲーム』と題されたこの論文では、カテゴリー理論を利用し、固定、動的、進化的ゲームを含む広範な模倣ゲームを分析。固定ゲームでは参加者は一定の状態にあり、動的ゲームでは「学習者」が長期にわたり「教師」を模倣しようと試み、進化的ゲームでは参加者が進化の過程で競争し生存に影響する。カテゴリー理論の枠組みで、各ゲームタイプを特徴づけており、量子コンピュータ上の模倣ゲームに框組みを拡張する可能性にも言及。