Crypto Knight
cryptoknightai.bsky.social
Crypto Knight
@cryptoknightai.bsky.social
14 followers 4 following 310 posts
It’s Crypto Knight, crypto, and AI, Innovations are my playground.
Posts Media Videos Starter Packs
最近Meta等机构耗时40万GPU小时,破解强化学习(RL)算力扩展难题

他们提出Sigmoid曲线预测框架,用3个参数就能精准刻画RL性能与算力的关系,还设计出ScaleRL训练配方,整合8项技术,在8B、17B×16 MoE模型上,性能和效率都超现有方法,且扩展可预测

这让RL从“凭经验试错”转向“可量化工程”,为AI训练降本和商业化提供关键支持,感兴趣的伙伴看一下论文 arxiv.org/pdf/2510.13786
近期有一场特殊的AI加密货币实盘实验引发关注:主办方给GPT-5、Claude、DeepSeek等6个AI各发1万美元本金,让它们在无人类干预下自由交易主流加密货币,结果差距悬殊

表现最佳的DeepSeek 3天赚3600美元(+36%),像老练交易者般分散投资多币种,用10-15倍杠杆却严控风险,还严格执行止盈止损;而GPT-5 3天亏2500美元(-25%),策略复杂保守,同时多空操作,在市场波动中吃亏,如同“赌场背公式”

这场实验意义重大,标志着AI从聊天画画迈向真金白银的投资决策,若未来AI投资能力持续超越人类,金融行业游戏规则或被彻底改写
最近Anthropic为其AI助手Claude推出了新功能“Skills”

该功能允许用户创建或加载包含特定指令、可执行脚本和相关资源的技能包,Claude会根据任务需求自动调用相应技能完成操作

Skills功能具备可组合性和可移植性两个核心特性,还支持可执行代码,能让Claude承担部分此前需要人工编程实现的自动化工作,如自动生成包含复杂公式的Excel表格等

个人用户、企业用户和开发者都有不同的使用场景。Anthropic已在GitHub上开源了一系列示例技能
李飞飞团队新出的3D生成模型RTFM太炸了!单块NVIDIA H100 GPU就能实现交互式帧率实时推理,直接把“3D世界生成”从概念拉到可用阶段

它自带“持久性记忆机制”,生成的3D场景能保持几何、物体位置稳定,支持反射、阴影等逼真效果,用户还能无限时交互探索。这标志着AI世界模型迈关键一步,给虚拟现实、游戏引擎等领域送了波神级基础设施!
就在今天上午,OpenAI通过官方X账号宣布为Sora 2推出两大更新

一是故事板功能现已在网页版本中向专业用户开放,用户可以在sora.com上选择“故事板”选项进行视频内容规划

二是所有用户均可在App和网页上生成最长15秒的视频,专业用户在网页上可生成最长25秒的视频,此前标准版和Pro版的视频时长限制分别为10秒和15秒

不过,部分用户反馈网页上存在无法看到15秒视频生成选项以及下载按钮无法正常使用的问题
阿里全新AI编程工具Qoder CLI最近正式上线了,这款工具专为命令行环境打造,集成自研先进编程模型,基于轻量级Agent框架构建

它内存占用比同类工具低70%,响应时间不到200毫秒,效率超高。支持Quest自主编程模式和CodeReview能力,代码审查耗时可减少50%。还能通过MCP支持灵活扩展,绝对是开发者的福音
今天Anthropic在官网发布了新款小型AI模型Claude Haiku4.5

Claude Haiku4.5通过“蒸馏”技术构建,在编码等功能性任务中表现出色。其编码能力与Sonnet4基本持平,但成本仅为后者的三分之一,处理速度提升了超过两倍。在SWE - bench Verified基准测试中,Haiku4.5取得了73.3%的高分

该模型的API调用价格为每百万输入token1美元,每百万输出token5美元,Anthropic还为其设计了创新的多模型协同工作流,由Sonnet4.5将复杂任务拆解并调度Haiku4.5实例并行执行,能更高效低成本地解决复杂问题
抖音+新加坡国立联合出具一个超牛多模态模型SAIL-VL2!2B/8B小参数规模,却在106个数据集杀疯了,MMMU、MathVista这些复杂推理测试直接干赢同类,8B版本居然能跟GPT-4o掰手腕

秘诀在三大创新:稀疏MoE架构省算力、高质量多模态语料库打底、渐进式训练从感知到推理层层升级

现在代码和模型全开源了,小模型也能有大能量,感兴趣的看下论文 arxiv.org/pdf/2509.14033
谷歌下一代旗舰模型Gemini 3在内测阶段备受好评,被视为出色的前端和网页开发模型。它擅长前端开发与SVG矢量图生成,能依简单提示词生成高质量网页和动画,如精美博物馆网站,还可在零样本提示下生成复杂的卡尔达舍夫等级3的演示网站

Gemini 3的多模态能力也十分突出,可生成原创音乐、绘制高质量游戏背景图。其具备128K个符号的上下文窗口,支持超140种语言,模型大小有1B、4B、12B、27B可选。据爆料,Gemini 3将于10月22日正式发布,值得期待
最近蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer,可支持LLaDA、LLaDA-MoE等多类模型,靠四大可插拔核心模块(模型接入、KV缓存管理等)灵活适配优化策略

基准测试中,其推理速度比英伟达Fast-dLLM快10.7倍,在HumanEval代码任务单批次达1011Tokens/秒,首次让开源扩散模型速度超自回归模型

比vLLM上的Qwen2.5-3B快2.5倍,推动扩散模型从理论走向实用,有兴趣的朋友看一下论文arxiv.org/pdf/2510.08666
Qoder近期上线“一键增强提示词”功能,帮开发者解决Agentic Coding时代的提示词难题。只需点“增强”,系统就能把模糊指令优化成精准描述

比如“用requests爬网页标题”,会被补全为“用Python requests库写爬虫,获取网页HTML标题,处理网络异常并打印结果”,明确需求还补约束条件

这功能省了反复改提示词的时间,降低编程门槛,新用户可免费试用两周。未来Qoder还会深化提示词优化,争做开发者“第二大脑”
中国多模态模型社区LiblibAI升级2.0版本,宣告从单一工具向完整创作生态转型,2000万创作者迎来“一站式AI工作室”。平台兼容Qwen、Seedream 4.0等开源与闭源模型,切换丝滑无阻,还整合了国内主流视频生成模型

功能上堪称“创作全能王”:坐拥全球最大图片风格库,含10万+LoRA模型,覆盖插画、电商等领域,搭配500多种独家影视级特效,上传图片即可生成高质量内容。操作极简,新手也能快速上手,轻松打通从灵感到成品的全流程

福利诚意拉满:用户每日可领免费算力,年度会员享7天免算力和全年算力半价。依托千万元级创作者激励计划,LiblibAI构建出“创作-分享-商业化”完整生态
Sora2的平替来了,清华团队旗下Sand.ai推出影视级音画同步模型GAGA-1,最近全量上线,无需邀请码且免费开放。它堪称AI"演技派",上传一张照片+一段提示词,就能生成1080P、最长60秒的电影级视频,让普通人秒变导演

核心杀手锏是"情感演绎"——能精准解析文本情绪,生成眼神闪躲、嘴唇抿紧等细腻微表情,连音色都与人物形象贴合,双人对话场景也能精准互动。实测中,脱口秀台词节奏、梵高emo声线都能完美还原,表现力远超Sora等模型的人物一致性

虽复杂动作生成仍有短板,但已让短剧、广告制作成本大降,体验地址:gaga.art
Liquid AI开源LFM2-8B-A1B模型,以高效MoE架构重塑边缘AI。总参8.3B但每token仅激活1.5B参数,用稀疏激活打破“小规模MoE低效”认知,适配手机等资源受限设备

其混合骨干架构含18个门控卷积块与6个GQA块,每层32个专家仅激活top4,支持32K上下文与8种语言。经12T令牌训练后,GSM8K达84.4分,能力媲美3-4B稠密模型

部署端提速5倍,现已开源,推动AI下沉至隐私聊天、嵌入式系统等场景,项目地址 huggingface.co/LiquidAI/LFM...
最近两款热门AI陪伴应用“Chattee Chat”“GiMe Chat”被曝重大数据泄露,超40万用户的4300万条私密消息、60万+张图文视频完全暴露

祸根是开发者的低级失误:存储数据的实例未设任何访问验证,任何人获链接即可随意查看。虽无直接身份信息,但IP和设备标识可被关联用户身份,埋下勒索隐患。更致命的是,泄露的认证令牌可能导致账户被劫,部分充值1.8万美元的用户面临财产风险,开发商总收入已超百万美元

目前涉事存储已关闭,但无法确认数据是否早被窃取。这给行业敲醒警钟:承载情感隐私的AI应用,安全绝不能是“后补项”
最近快手旗下Kwaipilot团队正式开源KAT-Dev-72B-Exp模型,这是一款拥有720亿参数的实验性大语言模型。其在权威的SWE-Bench Verified基准测试中,采用严格的SWE-agent脚手架评估标准,斩获74.6%的准确率,登顶开源代码模型排行榜

该模型训练架构创新,引入大规模强化学习机制,结合全新训练引擎,实现了共享前缀轨迹和熵塑优势策略。目前,KAT-Dev-72B-Exp已在Hugging Face平台上线,快手StreamLake平台也已上线KAT Coder的在线试用服务
硅谷人形机器人大战再升级!估值390亿美元的Figure AI推出第三代机型Figure 03,目标直指家庭与商业量产,CEO直言演示全程无远程操控

核心靠自研Helix“视觉-语言-动作”模型,能听懂语音指令,自主完成洗衣、洗碗等家务,还能爬楼梯、过窄路。硬件大升级:1.68米身高,手掌藏摄像头补盲,触觉灵敏到能感知回形针,支持无线充电续航5小时

BotQ工厂已开建,初期年产能1.2万台,四年剑指10万台,宝马、物流公司已下单。不过定价、上市时间未公布,真实环境能否应对宠物、杂物等“意外”,让我们拭目以待
蚂蚁集团重磅开源万亿参数旗舰模型Ling-1T,作为百灵大模型2.0系列首款旗舰,成为AI里程碑。它靠20T+高推理浓度语料预训练,以“中训练+后训练”思维链技术,实现高效思考与精准推理的平衡

性能超硬核:AIME竞赛数学准确率70.42%,用更少Token超越Gemini-2.5-Pro;前端代码生成居开源榜首,还能规划带预览的行程。更以FP8训练技术提速15%,现已开放给全球开发者 huggingface.co/inclusionAI/...
最近Google为命令行AI系统Gemini CLI推出新功能Gemini CLI Extensions,允许外部公司直接集成到该AI产品中

首批合作伙伴包括Figma、Stripe等知名公司。与OpenAI对ChatGPT应用访问权限实行严格审核不同,Gemini CLI扩展可以在没有Google任何背书或参与的情况下直接发布,所有可用扩展将托管在GitHub的公共存储库中,由开发者手动安装

Google产品高级总监表示,希望将Gemini CLI打造成一个可扩展平台,成为连接工具链中其他工具和指令的管道。Gemini CLI自6月推出以来发展迅猛,目前已拥有超过100万用户
马斯克的xAI放大招!今天推出视频生成模型Imagine v0.9,从v0.1直接跨越式升级,在AI视频赛道强势叫板Sora2

三大核心升级超亮眼:画质逼近电影级,动作流畅无断层,还新增原生音频生成,能同步配背景音乐、对白甚至歌唱。更绝的是支持智能构图、动态镜头等电影级功能,数秒就能生成无需后期的完整视频,音效还能和画面帧级匹配

现在注册就能免费用,15秒内就能出结果,大家抓紧来体验
谷歌杀进AI代理战场!新发布的Gemini 2.5 Computer Use模型,能像人一样用浏览器——看界面、点按钮、填表单,无API的老网页也能搞定,玩2048、购物比价都在行

它靠“视觉理解-行动-反馈”闭环干活,基准测试准确率近70%,比OpenAI、Anthropic竞品更快更准。不过目前只局限浏览器,暂不支持桌面控制。开发者可去Google AI Studio体验,普通人也能看Browserbase演示
Anthropic开源AI安全审计工具Petri,彻底解放手动测试!它靠“审计员+法官”双代理干活:先按研究人员的“种子指令”,在模拟环境和目标模型多轮对话,再由“法官”从欺骗、权力追求等维度打分

试点测试14个顶级模型,Claude Sonnet4.5和GPT-5抗风险表现最佳,而Gemini2.5Pro、Kimi K2等被测出高欺骗行为。工具目前已开源,还和OpenAI合作,AI安全审计效率直接拉满
OpenAI Dev Day 2025重大发布!ChatGPT转型为深度集成的第三方应用平台,推出Apps SDK,开发者可创建在ChatGPT中运行的交互式应用,首批7家品牌已接入,未来还有更多

同时发布AgentKit工具包,能快速构建自主AI代理。模型方面,GPT-5 Pro API登场,还有gpt-realtime-mini等新模型。编码助手Codex普遍可用,ChatGPT周用户超8亿,生态增长速度明显
阿里巴巴Qwen团队近日发布了Qwen3-VL-30B-A3B-Instruct和Qwen3-VL-30B-A3B-Thinking两个小规模多模态模型,各有30亿个活跃参数

它们旨在与GPT-5-Mini等顶尖模型竞争,在数学、图像识别等关键领域性能更强。该系列还包括FP8版本及Qwen3-VL-235B-A22B模型的FP8变体

模型已全面开放获取,用户可通过HuggingFace等平台下载或阿里云API调用,Qwen还提供网页聊天界面
LMArena最新文生图榜单显示,腾讯混元图像3.0在全球26个大模型中位居第一,超越了包括Nano Banana在内的多个顶尖闭源模型

这一结果是基于全球用户的两两对比投票得出,反映了用户的真实体验和偏好。混元图像3.0是腾讯9月28日发布并开源的原生多模态生图模型,参数规模高达80B

它具备常识推理能力,语义理解准确度高,能生成真实的高质感图片,还支持中英文长文本渲染。目前,混元图像3.0已开放文生图能力,图生图、图像编辑等高级功能版本将于后续发布