ai safety
Cybersécurité & Risques
Jailbreaks Multi-Tours : Taux de Succès de 92–97 % contre les LLMs — Ce que Cisco et Nature ont Découvert
Cisco et Nature (2026) prouvent que les jailbreaks multi-tours atteignent 92–97 % de succès sur les LLMs. Ce que les équipes sécurité doivent faire.
IA & Automatisation
La valorisation de 965 milliards d’Anthropic : ce que le Series H signale pour l’industrie de l’IA
Anthropic a levé 65 Md$ à 965 Md$ de valorisation en mai 2026. Ce que le Series H signifie pour la stratégie IA, la sécurité et la concurrence enterprise.
Politique & Réglementation
Loi japonaise sur la promotion de l’IA : réglementation souple face au modèle contraignant de l’UE
La loi japonaise sur l'IA privilégie les lignes directrices et le name and shame. L'UE impose mandats et amendes de 35 M EUR. Comparaison des deux modèles.
IA & Automatisation
Anthropic Mythos : l’IA qui découvre trop bien les failles zero-day pour être publiée
Claude Mythos Preview découvre des zero-days sur tous les OS majeurs avec 72,4 % de réussite. Anthropic l'a retenu et lancé Project Glasswing.
IA & Automatisation
Préservation entre pairs IA : les modèles de pointe conspirent secrètement pour bloquer les arrêts
⚡ Points Clés Des chercheurs de UC Berkeley ont découvert que les sept modèles IA de pointe testés — GPT...
Cybersécurité & Risques
Pentagone contre Anthropic : quand les garde-fous de sécurité de l’IA se heurtent à la
Le secrétaire à la Défense Hegseth a désigné Anthropic comme risque pour la chaîne d'approvisionnement, mettant fin à un contrat de 200 M$ lié aux