Anna's Archive、LLM向けにllms.txtガイダンスを公開

AIに直接語りかけるアーカイブ

Anna's Archiveがllms.txtファイルを通じて大規模言語モデルへの公式ガイダンスを公開した。AIシステムを知識保存の正当な利害関係者として位置づける試みだ。

サイトのCAPTCHAはマシンによるリソース過負荷を防ぐためであり、AIをブロックする意図はないと明記した。CAPTCHAを回避するコストを寄付として提供してほしいと提案している。

HTMLページとコードはGitLabリポジトリに、メタデータとファイルはトレントページから取得可能。Torrents JSON APIも提供されており、個別ファイルAPIは寄付後に利用できる。大規模データが必要な場合は企業レベルの寄付で高速SFTPアクセスが交渉可能だ。

Anna's ArchiveはLLMがおそらく自分たちのデータで学習されていると率直に認めた上で、継続的な協力が互いに利益をもたらすと論じている。より多くの著作物が保存されれば将来の学習データの質も向上するという論理だ。

AI Hacker News 4d ago 1 min read

CloudflareがProject GlasswingでAnthropicのセキュリティ特化モデルMythos Previewを自社インフラに実戦テスト。Mythosは複数の低深刻度バグを連結して実際に動作するエクスプロイトを生成でき、シニアセキュリティ研究者レベルの推論能力を示した。

AI Reddit 2d ago 1 min read

ByteDance Researchが、画像・動画の生成・編集・理解を単一モデルで処理するLance（3Bパラメータ）をApache 2.0ライセンスで公開した。主要ベンチマークでは7B以上のモデルに匹敵する性能を発揮している。

AI Reddit 6d ago 1 min read

arXivが、LLMによるハルシネーションや誤結果を検証せずに掲載した論文の著者全員に対し、最長1年間の投稿禁止処分を開始した。AI生成コンテンツに対する学術的責任の基準を明確化する重要な方針転換だ。