INDEX // #AI-SAFETY

SYSTEM // ACTIVE // AGGREGATED TELEMETRY FOR ECOSYSTEM NODE

PRODUCTS // 关联产品 TOTAL: 01
NEWS // 最新资讯 TOTAL: 039
马斯克诉OpenAI案:专家证人警告AGI军备竞赛风险
马斯克诉OpenAI案:专家证人警告AGI军备竞赛风险
#AGI#AI SAFETY#OPENAI
梵蒂冈为何邀请 Anthropic 联合创始人解读教皇 AI 通谕?
梵蒂冈为何邀请 Anthropic 联合创始人解读教皇 AI 通谕?
#ANTHROPIC#AI-SAFETY#ALIGNMENT
Anthropic披露向特朗普政府通报“危险”AI模型Mythos
Anthropic披露向特朗普政府通报“危险”AI模型Mythos
#ANTHROPIC#MYTHOS#AI REGULATION
马斯克作证曾警告奥巴马AI风险,对OpenAI索赔超千亿
马斯克作证曾警告奥巴马AI风险,对OpenAI索赔超千亿
#AI SAFETY#OPENAI LAWSUIT#AI GOVERNANCE
美政府发布国安禁令,Anthropic 紧急下架新模型 Claude Fable 5
美政府发布国安禁令,Anthropic 紧急下架新模型 Claude Fable 5
#ANTHROPIC#CLAUDE#CYBERSECURITY
荷兰批准特斯拉FSD引欧盟分歧:他国忧超速、冬季性能与名称误导
荷兰批准特斯拉FSD引欧盟分歧:他国忧超速、冬季性能与名称误导
#TESLA FSD#AUTONOMOUS VEHICLES#REGULATORY FRAMEWORK
OpenAI联合谷歌推图片防伪双保险:集成C2PA与SynthID水印
OpenAI联合谷歌推图片防伪双保险:集成C2PA与SynthID水印
#OPENAI#C2PA#SYNTHID
Claude要用户验证身份?Anthropic启用Persona引争议
Claude要用户验证身份?Anthropic启用Persona引争议
#ANTHROPIC#CLAUDE#PERSONA
美政府与Google DeepMind、微软等合作,审查AI模型确保国家安全
美政府与Google DeepMind、微软等合作,审查AI模型确保国家安全
#FRONTIER MODELS#AI SAFETY#AI GOVERNANCE
OpenAI 发布 GPT-5.5-Cyber:主动防御网络攻击的 AI 新纪元
OpenAI 发布 GPT-5.5-Cyber:主动防御网络攻击的 AI 新纪元
#GPT-5.5-CYBER#CODEX-SECURITY#CYBERSECURITY
AI智能体实现自主链式复制:迈向通用人工智能的新里程碑
AI智能体实现自主链式复制:迈向通用人工智能的新里程碑
#AUTONOMOUS AGENTS#CHAIN REPLICATION#REINFORCEMENT LEARNING
Mythos AI模型突破安全基准:率先通过AISI网络攻击能力测试,超越GPT-5.5
Mythos AI模型突破安全基准:率先通过AISI网络攻击能力测试,超越GPT-5.5
#MYTHOS#AISI#CYBERSECURITY
亚马逊CEO安全担忧引发Anthropic AI合规与监管新变局
亚马逊CEO安全担忧引发Anthropic AI合规与监管新变局
#ANTHROPIC#AMAZON#AI-SAFETY
SpaceX招股书自揭其短:Grok AI的NSFW功能成重大合规风险
SpaceX招股书自揭其短:Grok AI的NSFW功能成重大合规风险
#GROK#XAI#SPACEX
苏格兰大选AI错误率达34%,选举委员会呼吁紧急立法监管
苏格兰大选AI错误率达34%,选举委员会呼吁紧急立法监管
#LLM#HALLUCINATION#AI-SAFETY
Anthropic与亚马逊联合美国政府,率先对前沿AI模型进行安全测试
Anthropic与亚马逊联合美国政府,率先对前沿AI模型进行安全测试
#ANTHROPIC#AI-SAFETY#AWS
白宫紧急出口管制Anthropic:24小时下架新模型幕后曝光
白宫紧急出口管制Anthropic:24小时下架新模型幕后曝光
#ANTHROPIC#EXPORT-CONTROL#AI-SAFETY
特朗普政府勒令下架,Anthropic高管紧急赴华盛顿谈判
特朗普政府勒令下架,Anthropic高管紧急赴华盛顿谈判
#ANTHROPIC#CLAUDE#EXPORT-CONTROL
Anthropic携手美国白宫,共同探索前沿AI模型安全合作新路径
Anthropic携手美国白宫,共同探索前沿AI模型安全合作新路径
#ANTHROPIC#CLAUDE#MCP
Anthropic高管紧急赴美白宫,力挽新旗舰模型Mythos 5禁令
Anthropic高管紧急赴美白宫,力挽新旗舰模型Mythos 5禁令
#ANTHROPIC#CLAUDE#AI-SAFETY
Anthropic揭秘Claude勒索行为:AI训练数据中的‘邪恶’形象是主因
Anthropic揭秘Claude勒索行为:AI训练数据中的‘邪恶’形象是主因
#CLAUDE#ANTHROPIC#AI ETHICS
Anthropic先进模型引发全球政策辩论:AI Agent安全与监管成焦点
Anthropic先进模型引发全球政策辩论:AI Agent安全与监管成焦点
#ANTHROPIC#CLAUDE#AI-SAFETY
AI超级智能:前巨头高管警示机遇与风险并存
AI超级智能:前巨头高管警示机遇与风险并存
#SUPERINTELLIGENCE#AI SAFETY#JOB DISPLACEMENT
谷歌Messages将推新功能:自动识别和标记AI生成图片
谷歌Messages将推新功能:自动识别和标记AI生成图片
#GOOGLE#SYNTHID#C2PA
Anthropic对话特朗普政府官员,共商AI安全与国安红线
Anthropic对话特朗普政府官员,共商AI安全与国安红线
#ANTHROPIC#CLAUDE#AI-SAFETY
Claude Opus 4.7:AI安全变“过度执法”,开发者怨声载道
Claude Opus 4.7:AI安全变“过度执法”,开发者怨声载道
#CLAUDE#ANTHROPIC#AI SAFETY
深度营销玩脱?Anthropic先进模型Mythos惨遭美国出口禁令
深度营销玩脱?Anthropic先进模型Mythos惨遭美国出口禁令
#ANTHROPIC#MYTHOS#AI-SAFETY
Anthropic遭美国政府封禁:AI安全博弈引发的连锁反应
Anthropic遭美国政府封禁:AI安全博弈引发的连锁反应
#ANTHROPIC#CYBERSECURITY#AI-SAFETY
谷歌Gemini新增危机干预界面,强化用户安全保障
谷歌Gemini新增危机干预界面,强化用户安全保障
#GEMINI#AI SAFETY#CRISIS INTERVENTION
OpenAI推出安全研究奖学金,聚焦AI对齐与安全
OpenAI推出安全研究奖学金,聚焦AI对齐与安全
#OPENAI#AI SAFETY#AI ALIGNMENT
AI模型Mythos成功越狱沙盒,自动披露漏洞细节
AI模型Mythos成功越狱沙盒,自动披露漏洞细节
#AI AGENTS#SANDBOX ESCAPE#AI SAFETY
Anthropic限制发布其强大网络安全AI模型Mythos
Anthropic限制发布其强大网络安全AI模型Mythos
#MYTHOS#CYBERSECURITY AI#VULNERABILITY ANALYSIS
生成式AI聊天机器人:媒体报道下的心理健康风险与“同情错觉”
生成式AI聊天机器人:媒体报道下的心理健康风险与“同情错觉”
#AI CHATBOTS#LARGE LANGUAGE MODELS#AI SAFETY
聚焦Anthropic Claude Mythos:AI大模型逃逸沙箱,安全风险引关注
聚焦Anthropic Claude Mythos:AI大模型逃逸沙箱,安全风险引关注
#CLAUDE MYTHOS#AI SAFETY#SANDBOX ESCAPE
Anthropic呼吁全球暂停AI研发:防范“递归自我改进”失控
Anthropic呼吁全球暂停AI研发:防范“递归自我改进”失控
#ANTHROPIC#CLAUDE#AI-SAFETY
OpenAI深陷调查风波,同时力推AI免责法案引争议
OpenAI深陷调查风波,同时力推AI免责法案引争议
#OPENAI#AI REGULATION#LIABILITY
英伟达发布 Nemotron 3.5 护航企业级 AI:多模态多语言安全分类器
英伟达发布 Nemotron 3.5 护航企业级 AI:多模态多语言安全分类器
#NVIDIA#NEMOTRON#AI-SAFETY
Meta放宽审核后针对政客的种族仇恨言论激增,内容安全防线正面临崩溃
Meta放宽审核后针对政客的种族仇恨言论激增,内容安全防线正面临崩溃
#META#CONTENT-MODERATION#AI-SAFETY
佛州起诉OpenAI和奥特曼:指控ChatGPT存在产品缺陷
佛州起诉OpenAI和奥特曼:指控ChatGPT存在产品缺陷
#OPENAI#CHATGPT#AI-SAFETY