Machine unlearningは「再学習せずに消す」技術だが、証明が難しい。Google Researchは2026年6月10日、Regularized f-Divergence Kernel Testsを公開し、一部のprivacy violationを従来の数百万ではなく数千サンプルで検出したと報告した。
#privacy
RSS Feedマサチューセッツ州下院が、精密な位置情報の販売を禁じるプライバシー法案を146-0で可決した。100,000人超の消費者データを扱う企業が対象となり、広告技術、アプリ、データブローカーに直接影響する。
Google Chromeがユーザーの同意なしに4GBのGemini Nanoモデルを端末に自動インストールしていることが判明。削除しても再インストールされ、GDPR違反の疑いと環境負荷の問題も浮上している。
個人情報フィルタリングはAI開発の周辺機能ではなく本体になった。OpenAIの1.5BオープンウェイトPrivacy Filterは128,000トークンを端末内で処理し、補正版PII-Masking-300kでF1 97.43%を示した。
Hacker Newsはこの件を「Cookieなしでもセッションがつながる」タイプの深刻なプライバシー問題として受け止めた。MozillaはFirefox 150とESR 140.10.0で修正したとしているが、Tor BrowserのNew Identityにまで影響する点が議論を大きくした。
HNのGitHub CLI telemetry議論は、metricsの有用性よりもcommand-line toolでdefault-on collectionが許されるかに集中した。
HNが強く反応したのはAI training dataの不足ではなく、社員の日常入力がdataset化されるときのtrust boundaryだった。
r/LocalLLaMAで伸びた理由は、ID確認がlocal model論を速度ではなくautonomyの話に変えたからだ。AnthropicはClaude identity verificationでgovernment photo IDとlive selfieを求める場合があるとしている。
GoogleはGemini image generationを、長いprompt作成からaccount contextの利用へ寄せた。米国のGoogle AI Plus、Pro、Ultra加入者はGoogle PhotosとNano Banana 2を使い、source確認とreference変更をしながらpersonalized imagesを作れる。
HNが強く反応したのは、wrapperの好き嫌いではなく、local LLM stackで誰がcreditとcontrolを握るのかという違和感だった。Sleeping Robotsの記事は、Ollamaがllama.cppの上で広がりながら attribution、model packaging、cloud routing、model storageで信頼を削ったと批判し、コメント欄では「それでもUXは強い」という反論も出た。
人気のr/LocalLLaMA threadは、Gemma 4の256k context windowで100k+ tokenの個人journalをローカル分析した事例を示し、privacyがon-device LLMを動かす実用的な理由になり得ることを示した。
Meta は AI を全社的な risk review program の中心に置いたと説明した。documentation の事前入力、legal requirement の抽出、privacy・safety・security issue の早期検出を AI が支援するという内容だ。