pandas で時系列を扱う | 生成AIxPythonで始める株式分析|Python×J-Quants

株価データはほぼ常に時系列です。pandas には時系列を扱う専用の仕組みがあり、DatetimeIndex をうまく使うと、月次・週次への変換、移動平均、営業日調整までを短いコードで書けます。

本記事では、DatetimeIndex の作成から、resample によるリサンプリング、rolling による移動窓、営業日カレンダーの基本までを扱います。

インストール

pip install pandas

検証バージョン: Python 3.12.5 / pandas 2.2.3

サンプルデータの準備

連続した日付の終値を Series で用意します。

1
import numpy as np
2
import pandas as pd
3

4
rng = np.random.default_rng(42)
5
dates = pd.date_range("2026-01-05", periods=60, freq="B")  # 60 営業日
6
prices = 2900 + rng.normal(0, 30, size=len(dates)).cumsum()
7
close = pd.Series(prices.round(1), index=dates, name="C")
8
print(close.head())
9
print(close.index)

pd.date_range の freq="B" は 営業日(平日) の意味です。出力されるインデックスは DatetimeIndex で、時系列専用の機能が使えるようになります。

DatetimeIndex の便利機能

DatetimeIndex は、文字列での部分一致スライスができます。

1
print(close.loc["2026-01"])           # 1 月だけ
2
print(close.loc["2026-01":"2026-02"]) # 1 月から 2 月末まで

属性経由で年月日や曜日も取り出せます。

1
print(close.index.year[:5])
2
print(close.index.month[:5])
3
print(close.index.day_name()[:5])

DataFrame の列(Date)に対しても、pd.to_datetime で変換した後に .dt 経由で同じ機能が使えます。

1
df = close.reset_index().rename(columns={"index": "Date"})
2
df["weekday"] = df["Date"].dt.day_name()
3
print(df.head())

リサンプリング(日次 → 週次・月次)

resample は時間軸での再集計を行います。SQL の GROUP BY 月 に近い操作ですが、頻度の指定が文字列で簡潔です。

1
weekly = close.resample("W-FRI").last()    # 金曜終値ベースで週次に
2
monthly = close.resample("ME").last()       # 月末終値ベースで月次に
3
print(weekly.head())
4
print(monthly.head())

代表的な頻度コードを表にまとめます。

コード	意味
`D`	日次(暦日)
`B`	営業日(月〜金)
`W-FRI`	週次(金曜起点)
`ME`	月末(Month End)
`MS`	月初(Month Start)
`QE`	四半期末
`YE`	年末

集計関数は last のほか、first / mean / max / min / sum / agg が使えます。OHLC を作るには .agg が便利です。

1
ohlc_monthly = close.resample("ME").agg(["first", "max", "min", "last"])
2
ohlc_monthly.columns = ["O", "H", "L", "C"]
3
print(ohlc_monthly.head())

移動窓(rolling)

rolling は固定幅のウィンドウで集計を行います。移動平均線(SMA)はこの代表例です。

1
sma_5 = close.rolling(window=5).mean()
2
sma_25 = close.rolling(window=25).mean()
3
print(sma_5.head(10))

ウィンドウ幅に満たない先頭部分は NaN になります。これは仕様で、未来データを含めずに計算を始めるための保護です。

min_periods で「最低何件あれば計算する」を指定できます。先頭の NaN を減らしたいときに使います。

1
sma_5_relaxed = close.rolling(window=5, min_periods=1).mean()

集計関数は mean / sum / max / min / std / apply が使えます。

1
volatility_20 = close.pct_change().rolling(20).std(ddof=1)
2
print(volatility_20.tail())

拡張窓(expanding)

「先頭から現在までの累積」を計算するときは expanding を使います。

1
running_max = close.expanding().max()
2
print(running_max.tail())

最大ドローダウン(過去最高値からの下落率)の計算によく使います。

1
drawdown = close / running_max - 1
2
print(drawdown.min())   # 期間中の最大ドローダウン

シフトと差分

shift(n) は系列を n 行ずらします。リターン計算や先読み防止に必須です。

1
prev_close = close.shift(1)
2
ret = close / prev_close - 1
3
print(ret.head())

diff() は前期との差分(x - x.shift(1) と同等)を返します。

1
print(close.diff().head())

バックテストでは「当日のシグナルで翌日約定」を表現するため signal.shift(1) を使います(#11-3「移動平均クロス戦略を 5 銘柄でバックテスト」参照)。

営業日のずらし(BusinessDay)

「3 営業日後の日付」を扱うときは BusinessDay オフセットを使います。

1
from pandas.tseries.offsets import BusinessDay
2

3
today = pd.Timestamp("2026-04-30")
4
print(today + BusinessDay(3))   # 3 営業日後

日本の祝日を考慮するには pandas_market_calendars などの追加ライブラリが必要です。J-Quants 由来のデータは元々営業日のみが含まれるため、多くの場合は気にせずインデックスをそのまま使えます。

欠損日と再インデックス

複数銘柄を比較するとき、銘柄ごとに上場日が違って欠損日が生じることがあります。reindex で揃えてから ffill で前日値を埋めると、行数を合わせられます。

1
full_index = pd.date_range(close.index.min(), close.index.max(), freq="B")
2
aligned = close.reindex(full_index).ffill()
3
print(aligned.head())

ffill を使うかは分析目的次第です。リターン計算では「欠損日に値が無いまま」が正しいケースもあるため、機械的に埋めない判断も重要です。

生成AI へのプロンプト例

時系列処理は条件が増えがちです。前提を箇条書きで明示すると、生成AI のコードが安定します。

pandas で次の時系列処理を行うコードを書いてください。

入力:
- df(列: Date, Code, C)
- 期間: 約 4 年分、銘柄数 5

要件:
- Date を DatetimeIndex に設定
- 銘柄ごとに月末終値ベースの月次系列を作る
- 月次の単純リターンを計算
- 12 ヶ月の移動平均と標準偏差を追加
- 出力は Date(月末)を index、銘柄を columns に持つ DataFrame を 3 つ
  (price, return, volatility)
- pandas 2.2 系

入力の構造・出力の形・ライブラリ版を具体化すると、再現可能なコードが返ります。

まとめ

DatetimeIndex を持たせると、文字列スライスや年月日抽出など時系列特有の操作が可能になる
resample は時間軸の再集計、rolling は固定幅の移動窓
expanding は累積、shift / diff はずらしと差分
先読み防止のために、シグナル計算では shift(1) を必ず挟む

目次