Codexに学習させない設定とデータ漏洩の防ぎ方

「Codex（OpenAIのAIコーディング支援ツール）に業務のコードや顧客情報を打ち込んだら、それがそのままAIの学習に使われてしまうのではないか」——AIに開発を任せ始めた経営者や個人事業主の多くが、まずこの不安にぶつかります。

結論から言うと、Codexがあなたの入力を学習に使うかどうかは、契約しているプランと、たった数カ所の設定でほぼ決まります。個人向けプランは初期状態だと学習対象になり得ますが、手動でオフにできます。法人プランとAPI（プログラムから直接呼び出す利用形態）は、最初から学習対象外です。

株式会社Fyveでは、AI開発の受託や顧問の現場で日々Codexを業務に使っています。私自身が公式情報で確認した「学習させない」設定の手順と、設定だけでは防ぎきれない部分を運用でどうカバーするかを、専門用語をかみ砕いて解説します。

そもそもCodexは入力を学習に使うのか｜プランで答えが変わる

多くの人が「AIに入れた情報は全部学習される」と漠然と思っていますが、これは正確ではありません。使っているプランによって、学習に使われるかどうかの初期設定がまったく違うからです。ここを取り違えると、必要のない対策に時間を使ったり、逆に必要な対策を見落としたりします。

大きく分けると、次の3グループで扱いが変わります。

個人向けプラン（無料・Plus・Pro）：初期状態では入力が「モデル改善（＝学習）」に使われ得る。自分でオフにする必要がある
法人向けプラン（Team・Enterprise・Edu）：初めから学習対象外。契約として保証されている
API利用：2023年3月1日以降、初めから学習対象外。明示的に「使ってよい」と申請した場合のみ使われる

つまり、個人プランを業務で使っている人だけが、まず最優先で手を動かす必要があるということです。会社としてTeamやEnterpriseを契約していれば、この点については契約が守ってくれます。自分がどのグループにいるかを最初に確認してください。

個人プランでCodexに学習させない設定｜最優先の1手

無料・Plus・ProでCodexを使っている場合、最初にやるべきことは1つだけです。ChatGPTの設定で「モデル改善への利用」をオフにします。

手順はシンプルです。ChatGPTの「設定（Settings）」→「データコントロール（Data controls）」を開き、「すべての人のためにモデルを改善する（Improve the model for everyone）」をオフにします。これで、以後あなたが入力する内容は学習対象から外れます。

ここで重要なのは、Codex CLI（コマンドライン版）やエディタ拡張から入力した内容も、このChatGPTの設定に従うという点です。Codex側に独立した「学習させないスイッチ」があるわけではありません。Codex CLIの初期案内にも「学習データの設定（training data preferences）」としてChatGPTの設定画面へのリンクが用意されており、入口はあくまでChatGPT側に集約されています。この扱いは公式ヘルプでも明記されています（Using Codex with your ChatGPT plan）。

設定ファイルやコマンドを自分でいじる必要はありません。やることは「ChatGPTの設定画面でトグルを1つオフにする」だけ。ここが個人プランの土台になります。

見落としがちな2つの注意点

この設定には、知らないと足をすくわれる落とし穴が2つあります。

1つ目は、設定は「これから入力する分」にしか効かないこと。オフにする前に入れてしまった過去の会話は、別途履歴を削除する必要があります。しかも、削除しても即時に完全消去される保証はありません。だからこそ「機密はそもそも入れない」という発想が前提になります。

2つ目は、回答への「いいね・低評価」フィードバックの落とし穴です。学習オフにしていても、回答に👍や👎を送ると、その会話全体が改善のために使われ得ます。良かれと思って押した評価ボタンが、せっかくのオプトアウトを部分的に打ち消してしまうのです。業務利用ではフィードバックボタンを安易に押さない、と覚えておいてください（出典：OpenAI Help Center・Data Controls FAQ）。

法人プラン・APIを使う場合のデータ保護

会社として導入するなら、個人プランではなく法人プランやAPIを選ぶのが本筋です。これらは「設定でオフにする」のではなく、最初からデータが守られているのが大きな違いです。

法人プラン（Team・Enterprise・Edu）

ビジネス向けプランは、入力されたデータをデフォルトで学習に使いません。加えて、SSO（社員のログインを一括管理する仕組み）や監査ログ（誰が何をしたかの記録）で、組織として統制をかけられます。社員それぞれが個別に設定を変える必要がないため、「設定し忘れた人から漏れる」という人的ミスを構造的に防げるのが法人プランの価値です。

API利用とゼロデータ保持（ZDR）

APIは2023年3月1日以降、送信されたデータをデフォルトで学習に使わない方針です。ただし不正利用を監視する目的で、ログが最大30日間保持されます。この監視ログの保存すら避けたい場合は、承認制のZDR（Zero Data Retention＝ゼロデータ保持）を使うと、サーバ側にデータを残さない運用が可能です。医療・金融など特に機微な情報を扱う事業者向けの選択肢です（出典：OpenAI Developers・Your data）。

さらに、プラン横断の手段としてプライバシーポータル（privacy.openai.com）から「自分のコンテンツを学習に使わないでほしい（Do not train on my content）」と申請する方法もあります。設定トグルとは別ルートで意思表示できる仕組みです。

Codex CLIで漏洩リスクをさらに下げる設定項目

ここからは一歩進んだ話です。「学習させない」とは別の軸として、手元のパソコンに記録を残さない・余計な情報を送らないという観点があります。Codex CLIには、これを制御する設定が用意されています。

設定ファイル（config.toml）を直接書くのは難しく感じるかもしれませんが、ここでもAIに頼むのが早道です。Codexに「セッション履歴をローカルに保存しないよう、設定ファイルを書き換えて」と日本語で頼めば、該当箇所を直してくれます。何を頼めばよいか、主な項目を挙げます。

セッション履歴を残さない：会話の記録（history.jsonl）をパソコンに保存しない設定。共用端末や持ち出しPCでの利用時に有効
利用状況の自動送信を止める：匿名のテレメトリ（利用状況・動作データの自動送信）をオフにする設定
サーバへの応答保存を無効化：ZDR対応アカウント向けに、やり取りをサーバ側に残さない設定
プロンプトの外部送信を防ぐ：監視・分析の仕組みを使う場合でも、入力した文章そのものを外部に出さない設定

これらの正確な項目名や書式は、Codex公式の設定リファレンスに整理されています。なお「サーバへの応答保存を無効化」する設定は、主にZDRが有効なアカウントを前提にしたものなので、自分の契約で意味があるかは公式ドキュメントで確認してから使ってください。

非エンジニアの方は、まず前半の「個人プランの学習オフ」と次章の運用ルールだけ押さえれば十分です。この設定項目は、より厳密に管理したい人向けの追加対策と捉えてください。

設定だけに頼らない運用ルール｜最後の砦

ここまで設定の話をしてきましたが、現場で私が最も重視しているのは設定ではありません。「そもそも漏れて困るものを入れない」という運用ルールです。設定はいつ変わるか分からず、押し間違いも起きます。入れていない情報は、何があっても漏れません。

実際にデータ保護を意識して開発している人たちの間で共有されている、現実的なコツを整理します。

業務に個人アカウントを使わない：会社の情報は法人プランや組織のAPIキーで扱い、個人のアカウントと混ぜない
組織用のAPIキーを個人と分離する：誰のキーで何が使われたかを追えるようにし、流用を防ぐ
本当の機密は入れない：ID・パスワード・人事情報・未公開のシステム全体像などは、そもそも投入しない
コードは断片で、変数名は匿名化して渡す：システム全体ではなく必要な一部だけを、固有名詞をぼかして相談する
さらに厳格なら専用環境を併用する：Azure OpenAI（閉じた環境でOpenAIモデルを使える法人向けサービス）や、社内で完結するローカルLLM（自社サーバ内で動くAI）を組み合わせる

特に効くのが「コードは断片＋変数名の匿名化」です。AIに相談したいのは多くの場合ロジックであって、自社の顧客名やテーブル名そのものではありません。相談に必要な最小限だけを渡す習慣をつければ、設定が万一外れていても被害は限定されます。

よくある誤解と注意点

最後に、調べていると出てくる「噂レベルの情報」と、確実に押さえるべき事実を区別しておきます。判断材料を間違えると、対策そのものが的外れになるからです。

たとえば「特定のヘッダーを付ければ一発で学習を止められる」「クラウド版Codexには別の学習スイッチがある」といった話がSNSや二次まとめで流れることがあります。これらは現時点で公式ドキュメントに裏付けが確認できない情報です。鵜呑みにせず、必ず公式ヘルプや設定リファレンスで確認してください。学習オフの正規ルートは、あくまで前述の「ChatGPTの設定でトグルをオフ」です。

一方で、確実に注意すべき事実もあります。APIキーの流出は致命的です。キーが漏れて不正利用や不審な使われ方を疑われると、アカウントが即停止される事例も報告されています。「学習に使わないでほしい」と後から主張しても、対応してもらえないこともあります。キーの管理は、学習設定以上に厳重に行うべきです。

そして繰り返しになりますが、設定は「これから」にしか効きません。今日オフにしても、昨日入れた情報は別問題です。「入れる前に守る」が、すべての対策の土台になります。

Codexがそもそも何ができるツールなのか、全体像から押さえたい方はこちらをご覧ください。