AI Hacker News 3h ago 1 min read
世界最大のオープンライブラリAnna's Archiveが、大規模言語モデル向けにllms.txtガイダンスを公開しました。CAPTCHAはリソース保護目的であり、GitLab・トレント・JSON APIを通じた合法的バルクダウンロード経路を提案しています。
世界最大のオープンライブラリAnna's Archiveが、大規模言語モデル向けにllms.txtガイダンスを公開しました。CAPTCHAはリソース保護目的であり、GitLab・トレント・JSON APIを通じた合法的バルクダウンロード経路を提案しています。
HNが強く反応したのはAI training dataの不足ではなく、社員の日常入力がdataset化されるときのtrust boundaryだった。
GitHubはMarch 25, 2026にPrivacy StatementとTerms of Serviceを更新し、Copilot Free、Pro、Pro+のinteraction dataをAI trainingとproduct improvementに使えるようにした。変更はApril 24に発効し、BusinessとEnterpriseは対象外だ。