高配当利回りトップ 30 を AI と一緒に抽出する | 生成AIxPythonで始める株式分析|Python×J-Quants

配当利回り(株価に対する 1 株あたり配当の比率)は、ファンダメンタルズ分析でも最初に触れることの多い指標です。本記事は、銘柄一覧・財務情報・直近株価を組み合わせて配当利回りトップ 30 を抽出するまでの流れを、生成AI へのプロンプト → コード → 結果 → 落とし穴の順で公開します。

過去のデータでの集計結果は、将来の配当や株価を保証しません。本記事はあくまで「データの集計手順」を学ぶための教材です。

配当利回りの定義をそろえる

「配当利回り」と一口に言っても、数字の作り方は何通りかあります。本記事では次の式に固定します。

\text{配当利回り} = \frac{\text{1 株あたり年間配当}}{\text{直近終値}}

1 株あたり年間配当: 直近の本決算で開示された通期予想 DPS(Dividends Per Share)
直近終値: 集計実行日の前営業日の終値
単位: 小数(0.04 = 4.0%)

実務では「実績配当」「予想配当」「特別配当を含むか」で値が変わります。どの数字を使ったかをデータと一緒に記録する のが集計の基本です。

必要なライブラリ

pip install pandas numpy matplotlib

検証バージョン: Python 3.12.5 / pandas 2.2.3

サンプルデータの生成

本記事では仮想の銘柄データを使います。実際の分析では、このデータ生成部分を API やCSV 読み込みに差し替えます。データの入手方法は株価データの入手方法を参照してください。

1
"""sample_market_data.py
2
仮想の銘柄・財務・株価データを生成するユーティリティ。
3
"""
4
import numpy as np
5
import pandas as pd
6

7
def generate_market_data(n_companies: int = 80, seed: int = 42) -> dict[str, pd.DataFrame]:
8
    """仮想の上場企業データ一式を生成する。列名は J-Quants API に準拠。"""
9
    rng = np.random.default_rng(seed=seed)
10

11
    sectors = [
12
        "情報・通信業", "電気機器", "医薬品", "銀行業", "輸送用機器",
13
        "化学", "機械", "食料品", "小売業", "建設業",
14
        "鉄鋼", "海運業", "証券、商品先物取引業", "不動産業", "サービス業",
15
    ]
16

17
    # --- 銘柄一覧(/equities/master 相当) ---
18
    codes = [f"{1301 + i}" for i in range(n_companies)]
19
    sector_assign = rng.choice(sectors, size=n_companies)
20
    names = [f"サンプル商事{i+1:03d}" for i in range(n_companies)]
21

22
    listed = pd.DataFrame({
23
        "Code": codes,
24
        "CoName": names,
25
        "S33Nm": sector_assign,
26
    })
27

28
    # --- 財務情報(/fins/summary 相当。銘柄コード列は Code) ---
29
    base_dps = rng.exponential(scale=40, size=n_companies)
30
    # 約 15% の企業は無配
31
    base_dps[rng.random(n_companies) < 0.15] = 0.0
32
    base_dps = np.round(base_dps, 1)
33

34
    statements = pd.DataFrame({
35
        "Code": codes,
36
        "DiscDate": pd.Timestamp("2026-05-15"),
37
        "FDivAnn": base_dps,
38
    })
39

40
    # --- 株価(/equities/bars/daily 相当) ---
41
    base_price = rng.lognormal(mean=7.0, sigma=0.8, size=n_companies)
42
    close = np.round(base_price, 1)
43

44
    prices = pd.DataFrame({
45
        "Code": codes,
46
        "Date": pd.Timestamp("2026-05-27"),
47
        "C": close,
48
    })
49

50
    return {"listed": listed, "statements": statements, "prices": prices}

generate_market_data() を呼ぶと、銘柄一覧・財務情報・株価の 3 つの DataFrame が返ります。列名は J-Quants API の項目名に準拠しているため、データ取得部分を差し替えるだけで実データにも適用できます。

1
data = generate_market_data()
2
print(data["listed"].head())
3
print(data["statements"].head())
4
print(data["prices"].head())

生成AI へのプロンプト例

最初の叩き台はプロンプトから始めます。「目的・入力・出力・制約」を順に書くと、修正が少ないコードが返ってきます。

目的:
上場銘柄一覧と財務情報、直近株価を組み合わせて
配当利回りトップ 30 の表を作る。学習用なので売買推奨は含めない。

入力(列名は J-Quants API に準拠):
- listed(上場銘柄一覧)DataFrame: Code, CoName, S33Nm
- statements(財務情報)DataFrame: Code, DiscDate, FDivAnn
- prices(日次株価)DataFrame: Code, Date, C

出力:
- 配当利回り上位 30 銘柄のデータフレーム
  列: Code, CoName, S33Nm, C, dps, dividend_yield
- dividend_yield 降順、index は 0 から振り直し

制約:
- pandas 2.2 系
- 銘柄コードはどの表も Code 列。Code で結合する
- 各銘柄について「最新の DiscDate を 1 行だけ」採用する
- prices は最新営業日の C を使う
- FDivAnn が NaN や 0 の行は除外
- 100% 超の利回りは外れ値として除外

コード(コピペで動く)

1
"""high_dividend.py
2
銘柄一覧・財務情報・株価を結合し、配当利回りトップ 30 を抽出する。
3
"""
4
from __future__ import annotations
5

6
import pandas as pd
7

8
TOP_N = 30
9
YIELD_UPPER_LIMIT = 1.0  # 100% を超える値は外れ値として除外
10

11

12
def load_latest_dps(statements: pd.DataFrame) -> pd.DataFrame:
13
    """銘柄ごとに最新開示分の予想 DPS を 1 行に絞る。"""
14
    df = statements.dropna(subset=["FDivAnn"])
15
    df = df[df["FDivAnn"] > 0]
16
    # 銘柄ごとに最新の開示日を 1 行だけ残す
17
    df = df.sort_values(["Code", "DiscDate"])
18
    df = df.groupby("Code", as_index=False).tail(1)
19
    return df.rename(columns={"FDivAnn": "dps"})[["Code", "dps"]]
20

21

22
def load_latest_close(prices: pd.DataFrame) -> pd.DataFrame:
23
    """銘柄ごとに最新営業日の終値を取り出す。"""
24
    df = prices.sort_values(["Code", "Date"])
25
    df = df.groupby("Code", as_index=False).tail(1)
26
    return df[["Code", "C"]]
27

28

29
def extract_top_dividend(
30
    listed: pd.DataFrame,
31
    statements: pd.DataFrame,
32
    prices: pd.DataFrame,
33
) -> pd.DataFrame:
34
    dps = load_latest_dps(statements)
35
    close = load_latest_close(prices)
36

37
    # どの表も銘柄コードは Code。Code で結合する
38
    merged = (
39
        listed.merge(dps, on="Code")
40
        .merge(close, on="Code")
41
    )
42
    merged["dividend_yield"] = merged["dps"] / merged["C"]
43

44
    # 100% 超は明らかに入力ミスや特殊要因。外れ値として除外
45
    merged = merged[merged["dividend_yield"] < YIELD_UPPER_LIMIT]
46

47
    top = (
48
        merged.sort_values("dividend_yield", ascending=False)
49
        .head(TOP_N)
50
        .reset_index(drop=True)
51
    )
52
    top["dividend_yield_pct"] = (top["dividend_yield"] * 100).round(2)
53
    return top
54

55

56
# --- 実行 ---
57
data = generate_market_data()
58
top30 = extract_top_dividend(data["listed"], data["statements"], data["prices"])
59
print(top30[["Code", "CoName", "S33Nm", "C", "dps", "dividend_yield_pct"]])

実行結果(イメージ)

   Code  CoName     S33Nm   C    dps  dividend_yield_pct
0  1324  サンプル商事024        海運業       820.3   62.0                7.56
1  1348  サンプル商事048        鉄鋼       1180.5   85.0                7.20
2  1306  サンプル商事006   証券、商品先物取引業 1452.1  100.0                6.89
3  1362  サンプル商事062        銀行業       825.0   55.0                6.67
...

サンプルデータでも、利回りの高い銘柄が特定の業種に偏る傾向が見えます。これは実データでも同様で、業績変動が大きい業種(海運・鉄鋼・証券など)ほど、株価下落や一時的な高配当で利回りが高くなるパターンがあります。

業種別の分布を可視化する

1
import matplotlib.pyplot as plt
2
import matplotlib
3

4
matplotlib.rcParams["font.family"] = "sans-serif"
5

6
sector_counts = top30["S33Nm"].value_counts()
7

8
fig, ax = plt.subplots(figsize=(8, 5))
9
sector_counts.plot.barh(ax=ax, color="tab:blue", edgecolor="white")
10
ax.set_xlabel("Number of companies in Top 30")
11
ax.set_title("Dividend Yield Top 30 — Sector Distribution (Sample Data)")
12
ax.invert_yaxis()
13
ax.grid(axis="x", alpha=0.3)
14
plt.tight_layout()
15
plt.savefig("top30_sector.png", dpi=120)
16
plt.close(fig)

1 業種に集中している場合は、「利回りの高さ」が業種固有のリスクの裏返しである可能性を考えます。

落とし穴

集計を信じる前に確認しておきたい点をまとめます。

記念配当・特別配当: 一時的な配当が DPS に含まれていると、翌期から大きく下がる可能性があります。
無配転落リスク: 利回りが極端に高い銘柄は、株価が業績悪化を織り込んで下がっている場合があります。市場が「次回は減配・無配」を予想している可能性。
権利落ち日: 配当取得後に株価が落ちる日です。直前後で集計すると数値がブレます。
REIT・優先株: 計算式が同じでも、性質が普通株とは異なります。集計対象を S33Nm で絞るかどうかを意思決定する必要があります。
データ取得日のズレ: 財務情報の開示日と株価の最新日が大きく離れていないか確認します。

集計結果の追加検証

トップ 30 を眺めて終わりにせず、次の追加チェックを通すと信頼度が上がります。

業種ごとの分布: 表から S33Nm の構成比を出す。1 業種に偏っていないか。
市場区分: プライム / スタンダード / グロースのどこに集中しているか。
過去の配当推移: 過去 3 期の実績 DPS の平均で利回りを再計算して比較。

集計コードは 1 つに固定せず、定義を変えた版を 2 〜 3 種類作って結果が大きく変わらないかを見るのが、定量分析の作法です。

まとめ

配当利回りは「DPS / 株価」で計算するが、DPS の取り方で結果が変わる
高利回りの上位は業績変動の大きい業種が並びやすい
100% 超は外れ値として除外。1 度のクリーニングで終わらせず、複数視点で再計算する
集計結果は売買判断に直結させず、「データの傾向」として読む

過去の集計結果は将来の配当・株価を保証しません。本記事のコードは学習用です。