import numpy as np
import matplotlib.pyplot as plt
from scipy.linalg import matrix_power

class MarkovChain:
    """基础马尔科夫链类"""

    def __init__(self, transition_matrix, initial_distribution=None):
        """
        初始化马尔科夫链

        Parameters:
        -----------
        transition_matrix : array-like
            转移矩阵
        initial_distribution : array-like, optional
            初始分布，默认为均匀分布
        """
        self.P = np.array(transition_matrix)
        self.n_states = self.P.shape[0]

        # 验证转移矩阵的有效性
        self._validate_transition_matrix()

        # 设置初始分布
        if initial_distribution is None:
            self.pi0 = np.ones(self.n_states) / self.n_states
        else:
            self.pi0 = np.array(initial_distribution)

    def _validate_transition_matrix(self):
        """验证转移矩阵的有效性"""
        # 检查矩阵是否为方阵
        if self.P.shape[0] != self.P.shape[1]:
            raise ValueError("转移矩阵必须是方阵")

        # 检查所有元素是否非负
        if np.any(self.P < 0):
            raise ValueError("转移矩阵所有元素必须非负")

        # 检查每行和是否为1
        row_sums = np.sum(self.P, axis=1)
        if not np.allclose(row_sums, 1.0):
            raise ValueError("转移矩阵每行和必须为1")

    def simulate(self, n_steps, initial_state=None):
        """
        模拟马尔科夫链路径

        Parameters:
        -----------
        n_steps : int
            模拟步数
        initial_state : int, optional
            初始状态，默认根据初始分布随机选择

        Returns:
        --------
        path : list
            状态路径
        """
        if initial_state is None:
            current_state = np.random.choice(self.n_states, p=self.pi0)
        else:
            current_state = initial_state

        path = [current_state]

        for _ in range(n_steps):
            # 根据当前状态的转移概率选择下一状态
            next_state = np.random.choice(self.n_states, p=self.P[current_state])
            path.append(next_state)
            current_state = next_state

        return path

    def n_step_transition_matrix(self, n):
        """计算n步转移矩阵"""
        return matrix_power(self.P, n)

    def state_distribution(self, n):
        """计算n步后的状态分布"""
        return self.pi0 @ self.n_step_transition_matrix(n)

# 示例：天气模型
def weather_example():
    """天气马尔科夫链示例"""
    # 状态：0-晴天，1-雨天
    # 转移矩阵：今天晴天明天80%晴天20%雨天，今天雨天明天60%晴天40%雨天
    P = np.array([
        [0.8, 0.2],  # 晴天 -> [晴天, 雨天]
        [0.6, 0.4]   # 雨天 -> [晴天, 雨天]
    ])

    # 初始分布：今天晴天
    pi0 = np.array([1.0, 0.0])

    # 创建马尔科夫链
    weather_chain = MarkovChain(P, pi0)

    # 模拟30天天气
    weather_path = weather_chain.simulate(30, initial_state=0)

    # 打印结果
    weather_names = ['晴天', '雨天']
    print("30天天气模拟：")
    for i, state in enumerate(weather_path):
        print(f"第{i}天: {weather_names[state]}")

    # 计算长期分布
    print("\n长期天气分布：")
    for n in [1, 5, 10, 50]:
        dist = weather_chain.state_distribution(n)
        print(f"{n}天后: 晴天概率={dist[0]:.3f}, 雨天概率={dist[1]:.3f}")

    return weather_chain, weather_path

# 运行示例
if __name__ == "__main__":
    weather_chain, path = weather_example()

1.6 章节小结

本章学习了马尔科夫过程的基础理论，包括：

核心概念：马尔科夫性质（无记忆性）是马尔科夫过程的根本特征
数学定义：通过条件概率精确定义了马尔科夫过程
分类体系：按时间和状态空间对马尔科夫过程进行分类
转移概率：描述状态间转换的概率机制
转移矩阵：有限状态马尔科夫链的矩阵表示
Python实现：通过编程实现基础的马尔科夫链模拟

关键公式：

马尔科夫性质： $P(X_t \in A | X_{t_0}, \ldots, X_{t_n}) = P(X_t \in A | X_{t_n})$
Chapman-Kolmogorov方程： $p_{ij}^{(m+n)} = \sum_k p_{ik}^{(m)} p_{kj}^{(n)}$
有限维分布： $P(X_0 = i_0, \ldots, X_n = i_n) = \mu_{i_0} \prod_{k=0}^{n-1} p_{i_k i_{k+1}}$

这些基础理论为后续学习更复杂的马尔科夫模型和金融应用奠定了坚实基础。