最終更新: 2026年6月
「AIが生成したインジケーターが本当に機能するかどうか」——これを確かめる手段がなければ、実運用に使うことはできない。
Hedgrow FXには、生成したインジケーターをバックテストに接続して過去データで検証する機能がある。この機能がどう機能するか、数値評価の精度はどの水準か、そしてバックテスト結果をどう解釈すべきかを整理する。
Hedgrow FXのバックテスト機能の位置づけ
まず整理しておく。
Hedgrow FX(ヘッジロウFX)とは、AnthropicのAI「Claude」と日本語で会話しながらFX用インジケーターやEAを生成・改善できるトレーダー向けAIツールです。
バックテスト機能は単独で存在するのではなく、「インジケーター生成→バックテストで検証→修正→再検証」というイテレーションサイクルの一部として設計されている。
Claudeと会話しながらインジケータが作れるhedgrow-fxはこちら
従来のアプローチでは「ロジックを考える→コードに書く→バックテストツールに読み込む→数値を確認する→コードを修正する」という多段階の工程が必要だった。Hedgrow FXではこのサイクルの大部分が対話的に圧縮されている。
従来手順との具体的な違い:
| 作業 | 従来の手順 | Hedgrow FXを使う場合 | |---|---|---| | ロジック設計 | 自分でルールを文書化 | Claudeとの対話で仕様を言語化 | | コード生成 | MQL5を自力またはAI補助で記述 | Claudeが自動生成 | | エラー修正 | エラーを検索して自力修正 | エラー内容をClaudeに伝えて修正 | | バックテスト | MT5でパラメータ設定して実行 | 対話的に条件を指定して結果確認 | | ロジック改良 | コードを修正して再実行 | 「この条件を変えたい」と伝えるだけ |
この表の右列が常に優れているわけではない。精度の観点ではMT5のティックデータを使った検証の方が信頼性が高い場合がある。しかし「速くロジックの仮説検証を繰り返したい」という用途では、Hedgrow FXの対話的アプローチが大きく効率を上げる。
バックテストで確認できる数値
Hedgrow FXで生成したインジケーターのバックテストでは、以下の数値が確認できる。
勝率(Win Rate)
「バックテスト期間中にシグナル通りにエントリーした場合の勝率」だ。
ただし、勝率単体で評価する習慣をここで捨てることをお勧めする。勝率60%でも損益率が0.5以下(平均損失が平均利益の2倍)であれば、長期的には損失になる。逆に勝率30%でも損益率が3.0であれば理論的には利益になる。
勝率の適切な見方は「損益率との組み合わせ」だ。
期待値の計算式:
期待値 = (勝率 × 平均利益) - (負率 × 平均損失)
この値がプラスであれば、長期的には利益が積み上がる可能性がある。例えば勝率40%・平均利益30pips・平均損失15pipsの場合:
期待値 = (0.4 × 30) - (0.6 × 15) = 12 - 9 = 3pips(プラス)
勝率40%でもプラスの期待値を持てる。勝率だけで評価しないことの重要性がわかる。
プロフィットファクター(PF)
総利益 ÷ 総損失で計算される指標。1.0以上であればバックテスト上では利益、1.0未満であれば損失ということになる。
バックテスト期間と現在の相場環境の乖離を必ず考慮する。2015〜2020年のデータで計算したPF3.0のロジックが、2024〜2026年の相場では全く機能しないケースは珍しくない。特に「ロウボラティリティ相場に特化したロジック」を高ボラティリティ期間にテストすると、PFが大きく変わる。
PFの解釈の注意点:
PF2.0は「利益が損失の2倍」を意味するが、これはスプレッドとスリッページを考慮する前の数値だ。実運用ではコスト分だけPFが低くなる。スキャルピング系のロジックはスプレッドの影響が大きく、バックテストPF1.5が実運用では1.2まで下がるケースもある。
最大ドローダウン(MaxDD)
資産残高が最も減少した時点での、それ以前の高値からの落ち幅だ。
ここで重要なのは、バックテストのMaxDDを「将来起こりうるMaxDDの下限」として見るべきということだ。バックテストはヒストリカルデータに対する過去の実績だが、未来の相場ではより大きなDrawdownが発生する可能性が常にある。筆者が使う目安は「バックテストMaxDDの1.5倍を許容できるか」を運用前に確認することだ。
例えばバックテストMaxDDが10%のロジックでは、実運用では最大15%のドローダウンを想定して口座設計をする。これが証拠金維持率の設計にも直結する。
シグナル数と期待利得
バックテスト期間中のシグナル発生回数と、1シグナルあたりの期待損益(期待利得)だ。
期待利得がプラスであれば「サンプルが増えれば増えるほど利益に近づく確率が上がる」というロジックになる。ただし、これはシグナル間が独立した確率を前提としており、相場が特定のレジームに入ると独立性が崩れることがある点は留意が必要だ。
バックテスト結果の統計的解釈
数値が出た後の解釈の精度を上げるために、統計的な視点を加える。
サンプル数の問題
バックテスト期間中のシグナル数が少ない場合、PFや勝率の信頼性は低い。
目安として:
- シグナル数 < 30: 偶然の産物である可能性が高く、評価不能
- シグナル数 30〜100: 傾向の確認はできるが、本番使用前に追加検証が必要
- シグナル数 > 200: ある程度の統計的有意性がある
「シグナル数が5回でPF5.0」というロジックは、5回の幸運が重なった可能性が統計的に排除できない。
信頼区間の概念:
統計学では「サンプルが少ないと推定値の信頼区間が広くなる」という原理がある。100回のバックテストでPF1.5が出た場合の「真のPF」は、1.0〜2.0程度の幅で推定される。1,000回になると1.3〜1.7程度に絞られる。サンプルが多いほど、バックテストのPFが「実際のロジックの優位性」を精度高く反映する。
期間分割テスト
1つのバックテスト期間全体でPFが高くても、それが特定の期間(例:2020年のコロナ相場)に集中している可能性がある。
検証方法: バックテスト期間を前半・後半に2分割して、それぞれのPFを確認する。両方の期間でPFが1.0を超えていれば、ロジックの安定性が高い。片方にだけ偏っていれば、特定の相場環境への依存度が高い可能性がある。
Hedgrow FXでは「このロジックを2018〜2022年と2022〜2026年の2期間でそれぞれバックテストして比較したい」という依頼を対話的にできる。これはカーブフィッティングの有無を確認する実用的な方法だ。
ウォークフォワード的な検証
機械学習の訓練・検証データ分割に近い発想だが、バックテストでも有効だ。
過去5年のデータを持つ場合、前4年でロジックを調整・最適化し、最後の1年を「テストデータ」として使う。テストデータでのPFがトレーニングデータと大きく乖離していれば、カーブフィッティングの疑いが強い。
Hedgrow FXでのアプローチとして、「2020〜2024年のデータでロジックを調整した後、2025年のデータで評価する」という使い方が再現性確認に有効だ。
具体的な会話の流れ:
- 「USDJPYのH1チャートで2020〜2024年をバックテストしてください」→ PFと勝率を確認
- 「同じパラメーターで2025年のデータでバックテストしてください」→ 結果を比較
- 差が大きい場合は「ロジックの何が問題か分析してください」→ 改善点を特定
バックテスト結果からわかることとわからないこと
わかること
- 過去の特定期間でそのロジックが機能したかどうか
- ロジックの傾向(トレンドフォロー型・逆張り型・時間帯依存型等)
- 相場環境による成績の変動幅
- リスク・リターンの比率の傾向
わからないこと
- 将来の相場でそのロジックが機能するかどうか(これは誰にもわからない)
- リアル口座での約定コスト(スプレッド・スリッページ)込みの実際の成績
- レアイベント(ブラックスワン)への耐性
バックテスト結果は「このロジックが過去に機能した証拠」であり、「このロジックが将来も機能する証拠」ではない。この区別を明確に持ってから数値を見ると、適切な期待値が設定できる。
Hedgrow FXのバックテストと MetaTrader バックテストの違い
MetaTraderのストラテジーテスターと比較した場合の特徴を整理する。
Hedgrow FXのバックテスト機能の利点:
- ロジックの修正と再テストが対話的に完結する
- プログラミング知識なしに複数バリアントの比較ができる
- 期間・通貨ペア・パラメータの変更が会話ベースで指示できる
MetaTrader ストラテジーテスターの利点:
- ティックデータを使った高精度テストができる
- モデリング品質を明示的に確認できる
- スプレッドの詳細設定ができる
両者は排他的なツールではない。Hedgrow FXで生成・調整したEAをMT5のストラテジーテスターで最終確認するというフローが、精度と効率のバランスとして現実的だ。
実際のバックテスト検証フロー(例)
実際に使っているフローを共有する。
ステップ1: 仮説の言語化 「ロンドン時間帯・短期MAと中期MAのゴールデンクロス・RSIが50超」という条件でのロングエントリーを検証したい。
ステップ2: Hedgrow FXでインジケーター生成 上記条件をHedgrow FXに伝え、シグナルインジケーターを生成する。
ステップ3: 期間指定のバックテスト 「2020年〜2024年のEURUSD H1チャートでバックテスト」を依頼。PF・勝率・MaxDD・シグナル数を確認。
ステップ4: 条件の調整 PFが1.0を下回った場合、条件を修正してステップ3に戻る。これが「対話的最適化」の核心だ。
ステップ5: テスト期間の分割確認 前半(2020〜2022年)と後半(2022〜2024年)でそれぞれPFを確認する。
ステップ6: 2025年データでの最終検証 最終確認として直近データでテスト。カーブフィッティングの有無を確認する。
ステップ7: MT5での精密テスト Hedgrow FXでの検証を通過したロジックをMT5にエクスポートし、全ティックモードで最終バックテストを実施する。Hedgrow FXでの結果とMT5の結果を照合し、大きな乖離がないかを確認する。
内部リンク候補
- バックテストのPF基準の考え方は「FXバックテストのプロフィットファクター基準」を参照。
- MT5のストラテジーテスターの使い方は「FX MT5バックテストのやり方」を参照。
免責事項
本記事はHedgrow FXのバックテスト機能に関する情報提供を目的としており、投資収益を保証するものではありません。バックテストの結果は過去のデータに基づくものであり、将来の成績を保証するものではありません。FX取引には元本割れリスクが伴います。投資の判断はご自身の責任で行ってください。
よくある質問(FAQ)
Q: Hedgrow FXのバックテストはMetaTraderのバックテストと同じ精度ですか? A: 精度の観点では異なります。MetaTraderのストラテジーテスターはティックデータを使った高精度テストが可能です。Hedgrow FXの強みは対話的に条件を修正しながら繰り返しテストできる効率性にあります。両者を組み合わせることが最も精度と効率のバランスが良いフローです。
Q: バックテストでPFが高ければ実運用でも稼げますか? A: バックテストのPFは過去の相場での結果であり、将来を保証しません。カーブフィッティング・スプレッドコスト・約定環境の違いによって、実運用での成績はバックテストより低くなることが一般的です。Claudeと会話しながらインジケータが作れるhedgrow-fxでも、この点は明確に強調されています。
Q: バックテストに必要なシグナル数(サンプル数)の最低ラインは何件ですか? A: 統計的な意義が出始める最低ラインとして200件以上を目安にしています。30件未満は偶然の可能性が排除できず、信頼できる評価はできません。
Q: カーブフィッティングを避けるための具体的な方法は何ですか? A: バックテスト期間を前半・後半に分割して、両方でPFが1.0以上を維持しているかを確認することが有効です。また、最適化に使った期間とは別の期間(テスト期間)を設けて最終評価するウォークフォワード的な検証も有効です。
Q: Hedgrow FXで生成したインジケーターのバックテスト結果を信頼してよいですか? A: ロジックの傾向と相場依存性を確認する用途には有効です。ただし、過去の結果は将来の保証ではなく、リアル口座でのフォワードテストを経てから本格運用に移行することを推奨します。
Q: Hedgrow FXでバックテストできる通貨ペアと時間足に制限はありますか? A: 対応している通貨ペアと時間足の範囲はHedgrow FX公式サイト(https://hedgrow-fx.com/)で最新情報を確認することを推奨します。対応範囲はアップデートで変わる場合があります。
Q: Hedgrow FXとMT5のバックテスト結果が大きく違う場合、どちらを信頼すべきですか? A: MT5の全ティックモードでのバックテストの方が精度が高いため、精度面ではMT5の結果を優先することを推奨します。ただし、両者の乖離が大きい場合は、スプレッド設定やタイムゾーン設定の違いを確認することで原因を特定できることが多いです。
著者情報: 金融工学専攻・アルゴリズム取引経験者
