ボラティリティの低い銘柄を抽出して比較 | 生成AIxPythonで始める株式分析|Python×J-Quants

ボラティリティ(価格変動の大きさ)は、リターンと並ぶ定量分析の二大指標の一つです。本記事は、日次リターンの標準偏差を年率換算した「ヒストリカル・ボラティリティ」で銘柄をスクリーニングし、結果をリターンとの散布図で比較するまでを通しで公開します。

過去の集計結果は将来の値動きを保証しません。

ボラティリティの定義

本記事ではヒストリカル・ボラティリティを次で計算します。

\sigma_{\text{annual}} = \text{std}(r_t) \times \sqrt{252}

$r_t$ : 日次の対数リターン
252: 年間の営業日数のおおよその値
標本標準偏差(ddof=1)を使う

「直近 1 年(252 営業日)」を計算窓の基本にします。窓を変えると結果も変わるため、複数の窓で並行して見るのが定量分析の定石です。

集計のゴール

出力	内容
`low_vol_top30.csv`	過去 252 営業日のボラティリティが低い銘柄 30
`risk_return.png`	銘柄ごとの (年率リターン, 年率ボラ) 散布図

必要なライブラリ

pip install pandas numpy matplotlib

検証バージョン: Python 3.12.5 / pandas 2.2.3 / numpy 2.0 / matplotlib 3.9

コード(コピペで動く)

1
"""low_volatility.py
2
銘柄ごとに直近 252 営業日のヒストリカル・ボラティリティと年率リターンを計算し、
3
低ボラティリティ・トップ 30 を抽出する。
4
"""
5
from __future__ import annotations
6

7
import numpy as np
8
import pandas as pd
9
import matplotlib.pyplot as plt
10

11
PRICES_PATH = "prices.csv"             # Code, Date, C
12
LISTED_PATH = "listed_info.csv"        # Code, CoName, S33Nm
13
WINDOW = 252
14
TOP_N = 30
15

16

17
def compute_metrics(df: pd.DataFrame) -> pd.DataFrame:
18
    """Code ごとに対数リターンの統計量を計算し、年率指標を返す。"""
19
    df = df.sort_values(["Code", "Date"]).copy()
20
    df["log_ret"] = np.log(df["C"] / df.groupby("Code")["C"].shift(1))
21

22
    # 直近 WINDOW 営業日に絞る(銘柄ごと)
23
    df = df.dropna(subset=["log_ret"])
24
    df = df.groupby("Code", group_keys=False).tail(WINDOW)
25

26
    grouped = df.groupby("Code")["log_ret"]
27
    out = pd.DataFrame({
28
        "n": grouped.size(),
29
        "ret_daily_mean": grouped.mean(),
30
        "ret_daily_std":  grouped.std(ddof=1),
31
    }).reset_index()
32

33
    out["ret_annual"] = out["ret_daily_mean"] * 252
34
    out["vol_annual"] = out["ret_daily_std"]  * np.sqrt(252)
35
    return out
36

37

38
def main() -> None:
39
    prices = pd.read_csv(PRICES_PATH, parse_dates=["Date"])
40
    listed = pd.read_csv(LISTED_PATH)[["Code", "CoName", "S33Nm"]]
41

42
    metrics = compute_metrics(prices)
43
    # 集計に必要な営業日が揃っている銘柄だけ採用(上場直後を弾く)
44
    metrics = metrics[metrics["n"] >= WINDOW * 0.9]
45

46
    merged = metrics.merge(listed, on="Code")
47
    low_vol = (
48
        merged.sort_values("vol_annual")
49
        .head(TOP_N)
50
        .reset_index(drop=True)
51
    )
52
    low_vol["vol_annual_pct"] = (low_vol["vol_annual"] * 100).round(2)
53
    low_vol["ret_annual_pct"] = (low_vol["ret_annual"] * 100).round(2)
54
    print(low_vol[["Code", "CoName", "S33Nm", "ret_annual_pct", "vol_annual_pct"]])
55
    low_vol.to_csv("low_vol_top30.csv", index=False)
56

57
    # リスク・リターン散布図
58
    fig, ax = plt.subplots(figsize=(8, 6))
59
    ax.scatter(merged["vol_annual"] * 100, merged["ret_annual"] * 100, s=8, alpha=0.4, label="all")
60
    ax.scatter(low_vol["vol_annual"] * 100, low_vol["ret_annual"] * 100, s=30, color="crimson", label="low-vol top30")
61
    ax.set_xlabel("Volatility (annualized, %)")
62
    ax.set_ylabel("Return (annualized, %)")
63
    ax.set_title("Risk vs Return — last 252 trading days")
64
    ax.axhline(0, color="gray", linewidth=0.8)
65
    ax.grid(alpha=0.3)
66
    ax.legend()
67
    plt.tight_layout()
68
    plt.savefig("risk_return.png", dpi=120)
69
    plt.close(fig)
70

71

72
if __name__ == "__main__":
73
    main()

実行結果(イメージ)

   Code  CoName       S33Nm  ret_annual_pct  vol_annual_pct
0  XXXX  サンプル食品A          食料品                4.32           12.45
1  XXXX  サンプル食品B          食料品             5.10           13.22
2  XXXX  サンプル医薬A          医薬品             3.85           13.50
3  XXXX  サンプル鉄道A          陸運業             2.10           13.95
...

低ボラティリティ側には食料品・医薬品・陸運業など、業績が比較的安定する業種が並びがちです。

risk_return.png には、全銘柄のグレーの点と低ボラ・トップ 30 の赤い点が描かれます。低ボラ側に集まりつつ、リターンが正・負に分散している様子が見て取れるはずです。

スクリーニング条件の組み立て

低ボラだけで終わらせず、複数条件を組み合わせるのがスクリーニングの基本です。

1
condition = (
2
    (merged["vol_annual"] < 0.20)        # ボラ 20% 未満
3
    & (merged["ret_annual"] > 0.0)       # リターン プラス
4
    & (merged["n"] >= WINDOW)            # 営業日が揃っている
5
)
6
filtered = merged[condition].sort_values("vol_annual")

条件の数は 小さく始めて 1 つずつ追加 します。最初から多重条件を組むと、結果が 0 件になった原因を切り分けにくくなります。

チャートで「触って探る」

低ボラ・トップ 30 の銘柄は数が多いので、Plotly でホバー表示できる散布図にしておくと、後で振り返るときに名前と業種を確認しやすくなります。Plotly 版の散布図は#12-2「Plotly 応用 — リターン分布・相関行列・ドローダウンの可視化」で扱います。

落とし穴

窓のサイズ依存: 60 日 / 252 日 / 504 日で順位がかなり変わります
上場期間が短い銘柄: 観測数が足りない銘柄は標準偏差が信頼できません。n でフィルタする
取引停止・ストップ高安: 連日同値や寄らないストップが続くと、ボラが過小評価される
対数 vs 単純: 短期ならほぼ同じ。長期は対数の方が累積リターンと整合的
生存バイアス: 上場廃止銘柄を含まないデータで集計すると、低ボラ・高リターン側に楽観的なバイアスがかかる

まとめ

ヒストリカル・ボラティリティは「日次リターン標準偏差 × √252」で年率化
低ボラ・トップ 30 は食料品・医薬品など安定業種が並びやすい
リスク・リターン散布図でランキングと全体像を同時に把握する
窓サイズ・データ期間・対数 / 単純の選択を記録する

過去のボラティリティは将来の値動きを保証しません。

目次