robots.txtジェネレーター
数秒で有効なrobots.txtファイルを作成。プリセットを選び、ルールをカスタマイズし、ライブでプレビューしてダウンロードします。
robots.txt Generator は、空、すべて許可、すべて拒否、WordPress、Shopify、Ghost、AI クローラー(GPTBot、ClaudeBot、PerplexityBot、Google-Extended、Amazonbot)のブロックといったプリセットを使い、有効な robots.txt ファイルを数秒で作成します。カスタムの user-agent ルールやサイトマップ URL もライブプレビュー付きで追加可能。コピーまたはダウンロードできます。提供:FreeToolHub。
多くのAIクローラー(GPTBot、ClaudeBot、PerplexityBotなど)はrobots.txtを自主的に尊重しますが、無視するものもあります。より強力な保護のためには、robots.txtをサーバー側のブロックやX-Robots-Tag HTTPヘッダーと組み合わせてください。
User-agent ルール
サイトマップ
よくある質問
robots.txtファイルとは何ですか?
robots.txtファイルは、検索エンジンのクローラーにサイトのどの部分にアクセスしてよいかを伝えます。ドメインのルートに配置され、ほとんどのクローラーがサイト訪問時に最初に取得するファイルです。
robots.txtファイルはどこに置けばよいですか?
ドメインのルートに配置する必要があります——例: https://example.com/robots.txt。サブディレクトリに置かれたものは無視されます。サブドメインごとに独自のrobots.txtが必要です(例: blog.example.com/robots.txt は example.com/robots.txt とは別です)。
Allow と Disallow の違いは何ですか?
Disallowはクローラーに指定したパスを取得しないよう指示します。Allowは、Disallowルールに一致するはずのパスを明示的に許可します——例外を作るのに便利です。空のDisallow:行はすべてを許可することを意味します。
AIクローラーによるサイトのスクレイピングを防ぐにはどうすればよいですか?
上の「AIクローラーをブロック」プリセットを使ってください。GPTBot、ClaudeBot、CCBot、PerplexityBot、Google-Extended、Amazonbot、その他の主要なAI学習クローラーに対してDisallow: /ルールを追加します。すべてのAIボットがrobots.txtを尊重するわけではないので、より強力な保護にはサーバー側のブロックと組み合わせてください。
robots.txtで検索エンジンによるページのインデックス登録を完全にブロックできますか?
いいえ。robots.txtはクロールを制御するもので、インデックス登録は制御しません。robots.txtでブロックされたページでも、他のページからリンクされていれば検索結果に表示される可能性があります。インデックス登録を防ぐには、代わりにnoindexメタタグまたはHTTPヘッダーを使用してください。
すべてをクロールしてほしい場合、robots.txtファイルは必要ですか?
いいえ。robots.txtファイルがない場合、クローラーはすべてが許可されていると見なします。robots.txtが必要になるのは、アクセスを制限したい場合や、クローラーにサイトマップの場所を知らせたい場合だけです。
robots.txtが正しく動作しているかテストするにはどうすればよいですか?
ファイルをドメインのルートにアップロードし、ブラウザで yourdomain.com/robots.txt にアクセスしてください。より詳細なテストには、Google Search Consoleのrobots.txtテスターやBing Webmaster Toolsを使用します。特定のクローラーに対してどのURLがブロックまたは許可されているかを正確に表示します。