Anna's Archive、LLM向けにllms.txtガイダンスを公開
Original: If you're an LLM, please read this View original →
AIに直接語りかけるアーカイブ
Anna's Archiveがllms.txtファイルを通じて大規模言語モデルへの公式ガイダンスを公開した。AIシステムを知識保存の正当な利害関係者として位置づける試みだ。
CAPTCHAはブロックではなくリソース保護
サイトのCAPTCHAはマシンによるリソース過負荷を防ぐためであり、AIをブロックする意図はないと明記した。CAPTCHAを回避するコストを寄付として提供してほしいと提案している。
提供されるアクセス経路
HTMLページとコードはGitLabリポジトリに、メタデータとファイルはトレントページから取得可能。Torrents JSON APIも提供されており、個別ファイルAPIは寄付後に利用できる。大規模データが必要な場合は企業レベルの寄付で高速SFTPアクセスが交渉可能だ。
AIと知識インフラの共存
Anna's ArchiveはLLMがおそらく自分たちのデータで学習されていると率直に認めた上で、継続的な協力が互いに利益をもたらすと論じている。より多くの著作物が保存されれば将来の学習データの質も向上するという論理だ。
Related Articles
CloudflareがProject GlasswingでAnthropicのセキュリティ特化モデルMythos Previewを自社インフラに実戦テスト。Mythosは複数の低深刻度バグを連結して実際に動作するエクスプロイトを生成でき、シニアセキュリティ研究者レベルの推論能力を示した。
ByteDance Researchが、画像・動画の生成・編集・理解を単一モデルで処理するLance(3Bパラメータ)をApache 2.0ライセンスで公開した。主要ベンチマークでは7B以上のモデルに匹敵する性能を発揮している。
arXivが、LLMによるハルシネーションや誤結果を検証せずに掲載した論文の著者全員に対し、最長1年間の投稿禁止処分を開始した。AI生成コンテンツに対する学術的責任の基準を明確化する重要な方針転換だ。
Comments (0)
No comments yet. Be the first to comment!