Chapter 11: Matrix Diagonalization Theory

Haiyue

October 7, 2025

32min

Chapter 11: Matrix Diagonalization Theory

Learning Objectives

Understand conditions for matrix diagonalization
Master methods for matrix diagonalization
Understand properties of similar matrices
Master basic concepts of Jordan canonical form
Understand the geometric meaning of diagonalization

Basic Concepts of Matrix Diagonalization

Definition

For an $n \times n$ matrix $A$ , if there exists an invertible matrix $P$ and diagonal matrix $D$ such that: $P^{-1}AP = D$

Then matrix $A$ is called diagonalizable, and $P$ is called the diagonalizing matrix.

Equivalent Conditions for Diagonalization

Matrix $A$ is diagonalizable if and only if:

$A$ has $n$ linearly independent eigenvectors
For each eigenvalue, its geometric multiplicity equals its algebraic multiplicity
$A$ is similar to some diagonal matrix

import numpy as np
import matplotlib.pyplot as plt
from scipy.linalg import eig, inv
import matplotlib.patches as patches

def diagonalization_demo():
    """Demonstrate matrix diagonalization process"""

    # Diagonalizable matrix example
    A = np.array([[4, 1],
                  [2, 3]], dtype=float)

    print("Original matrix A:")
    print(A)

    # Calculate eigenvalues and eigenvectors
    eigenvals, eigenvecs = eig(A)

    print(f"\nEigenvalues: {eigenvals}")
    print(f"Eigenvector matrix P:\n{eigenvecs}")

    # Construct diagonal matrix
    D = np.diag(eigenvals)
    P = eigenvecs
    P_inv = inv(P)

    print(f"\nDiagonal matrix D:\n{D}")

    # Verify diagonalization
    result = P_inv @ A @ P
    print(f"\nP^(-1)AP =\n{result}")
    print(f"Equal to D: {np.allclose(result, D)}")

    # Verify inverse transformation
    reconstructed_A = P @ D @ P_inv
    print(f"\nPDP^(-1) =\n{reconstructed_A}")
    print(f"Equal to original matrix A: {np.allclose(reconstructed_A, A)}")

    return A, P, D

A, P, D = diagonalization_demo()

Properties of Similar Matrices

Definition of Similar Matrices

If there exists an invertible matrix $P$ such that $B = P^{-1}AP$ , then matrices $A$ and $B$ are called similar, denoted as $A \sim B$ .

Important Properties of Similar Matrices

Similar matrices have the same:

Eigenvalues
Determinant
Trace (sum of diagonal elements)
Rank
Characteristic polynomial

def similarity_properties_demo():
    """Demonstrate properties of similar matrices"""

    # Original matrix
    A = np.array([[2, 1, 0],
                  [1, 2, 1],
                  [0, 1, 2]], dtype=float)

    # Random invertible transformation matrix
    np.random.seed(42)
    P = np.random.randn(3, 3)
    while np.abs(np.linalg.det(P)) < 0.1:  # Ensure P is invertible
        P = np.random.randn(3, 3)

    P_inv = inv(P)

    # Calculate similar matrix
    B = P_inv @ A @ P

    print("Original matrix A:")
    print(A)
    print(f"\nTransformation matrix P:\n{P}")
    print(f"\nSimilar matrix B = P^(-1)AP:\n{B}")

    # Verify properties of similar matrices
    properties = {
        "Eigenvalues": (np.sort(eig(A)[0]), np.sort(eig(B)[0])),
        "Determinant": (np.linalg.det(A), np.linalg.det(B)),
        "Trace": (np.trace(A), np.trace(B)),
        "Rank": (np.linalg.matrix_rank(A), np.linalg.matrix_rank(B))
    }

    print(f"\nVerifying properties of similar matrices:")
    print("=" * 50)
    for prop_name, (val_A, val_B) in properties.items():
        if prop_name == "Eigenvalues":
            equal = np.allclose(val_A, val_B)
            print(f"{prop_name}:")
            print(f"  A: {val_A}")
            print(f"  B: {val_B}")
        else:
            equal = np.isclose(val_A, val_B)
            print(f"{prop_name}: A={val_A:.4f}, B={val_B:.4f}")
        print(f"  Equal: {equal}")
        print("-" * 30)

similarity_properties_demo()

Diagonalization Algorithm

Standard Diagonalization Steps

Calculate eigenvalues: solve $\det(A - \lambda I) = 0$
For each eigenvalue, find corresponding eigenvectors
Check if there are enough linearly independent eigenvectors
Construct matrix $P = [v_1, v_2, \ldots, v_n]$
Verify $P^{-1}AP = D$

def diagonalization_algorithm():
    """Complete matrix diagonalization algorithm"""

    def diagonalize_matrix(A):
        """
        Matrix diagonalization algorithm
        Returns: (is_diagonalizable, P, D)
        """
        n = A.shape[0]

        # Step 1: Calculate eigenvalues and eigenvectors
        eigenvals, eigenvecs = eig(A)

        # Step 2: Check linear independence of eigenvectors
        rank_eigenvecs = np.linalg.matrix_rank(eigenvecs)

        if rank_eigenvecs == n:
            # Diagonalizable
            P = eigenvecs
            D = np.diag(eigenvals)
            return True, P, D
        else:
            # Not diagonalizable
            return False, None, None

    # Test matrix 1: Diagonalizable matrix
    print("Test matrix 1: Diagonalizable matrix")
    A1 = np.array([[3, 1],
                   [0, 2]], dtype=float)

    print(f"Matrix A1:\n{A1}")

    is_diag1, P1, D1 = diagonalize_matrix(A1)

    if is_diag1:
        print("Matrix is diagonalizable!")
        print(f"Diagonalizing matrix P:\n{P1}")
        print(f"Diagonal matrix D:\n{D1}")

        # Verification
        verification = inv(P1) @ A1 @ P1
        print(f"Verification P^(-1)AP:\n{verification}")
        print(f"Error: {np.linalg.norm(verification - D1):.2e}")
    else:
        print("Matrix is not diagonalizable")

    print("\n" + "="*50 + "\n")

    # Test matrix 2: Non-diagonalizable matrix (repeated eigenvalue with insufficient geometric multiplicity)
    print("Test matrix 2: Non-diagonalizable matrix")
    A2 = np.array([[2, 1],
                   [0, 2]], dtype=float)

    print(f"Matrix A2:\n{A2}")

    is_diag2, P2, D2 = diagonalize_matrix(A2)

    if is_diag2:
        print("Matrix is diagonalizable!")
        print(f"Diagonalizing matrix P:\n{P2}")
        print(f"Diagonal matrix D:\n{D2}")
    else:
        print("Matrix is not diagonalizable")

        # Analyze reason
        eigenvals2, eigenvecs2 = eig(A2)
        print(f"Eigenvalues: {eigenvals2}")
        print(f"Rank of eigenvector matrix: {np.linalg.matrix_rank(eigenvecs2)}")
        print("Reason: Geometric multiplicity of repeated eigenvalue less than algebraic multiplicity")

    print("\n" + "="*50 + "\n")

    # Test matrix 3: Symmetric matrix (always diagonalizable)
    print("Test matrix 3: Symmetric matrix")
    A3 = np.array([[1, 2, 3],
                   [2, 4, 5],
                   [3, 5, 6]], dtype=float)

    print(f"Matrix A3:\n{A3}")
    print(f"Is symmetric: {np.allclose(A3, A3.T)}")

    is_diag3, P3, D3 = diagonalize_matrix(A3)

    if is_diag3:
        print("Symmetric matrix is diagonalizable!")
        print(f"Eigenvalues: {np.diag(D3)}")

        # Verify orthogonality of eigenvectors (for symmetric matrices)
        dot_products = []
        for i in range(3):
            for j in range(i+1, 3):
                dot_prod = np.dot(P3[:, i], P3[:, j])
                dot_products.append(dot_prod)
                print(f"v{i+1} · v{j+1} = {dot_prod:.2e}")

        print(f"Eigenvectors are orthogonal: {np.allclose(dot_products, 0, atol=1e-10)}")

diagonalization_algorithm()

Geometric Meaning of Diagonalization

Coordinate Transformation Perspective

Diagonalization essentially finds an eigenvector basis, where the linear transformation appears as simple coordinate scaling.

def geometric_interpretation():
    """Geometric interpretation of diagonalization"""

    # Define diagonalizable matrix
    A = np.array([[3, 1],
                  [1, 2]], dtype=float)

    # Diagonalize
    eigenvals, eigenvecs = eig(A)
    P = eigenvecs
    D = np.diag(eigenvals)

    print("Original matrix A:")
    print(A)
    print(f"Eigenvalues: {eigenvals}")

    # Create test vectors
    test_vectors = np.array([[1, 0, 1, 1],
                            [0, 1, 1, -1]])

    fig, axes = plt.subplots(2, 3, figsize=(15, 10))

    # First row: Transformation in standard basis
    ax1, ax2, ax3 = axes[0]

    # Original vectors (standard basis)
    for i in range(test_vectors.shape[1]):
        ax1.arrow(0, 0, test_vectors[0, i], test_vectors[1, i],
                 head_width=0.1, head_length=0.1, fc='blue', ec='blue',
                 alpha=0.7, label=f'v{i+1}' if i < 2 else None)

    # Draw standard basis
    ax1.arrow(0, 0, 1, 0, head_width=0.05, head_length=0.05,
             fc='red', ec='red', linewidth=2, label='e1')
    ax1.arrow(0, 0, 0, 1, head_width=0.05, head_length=0.05,
             fc='green', ec='green', linewidth=2, label='e2')

    ax1.set_xlim(-1.5, 2)
    ax1.set_ylim(-1.5, 2)
    ax1.grid(True, alpha=0.3)
    ax1.set_aspect('equal')
    ax1.legend()
    ax1.set_title('Original Vectors (Standard Basis)')

    # Transformed vectors (standard basis)
    transformed_vectors = A @ test_vectors

    for i in range(test_vectors.shape[1]):
        ax2.arrow(0, 0, test_vectors[0, i], test_vectors[1, i],
                 head_width=0.1, head_length=0.1, fc='blue', ec='blue',
                 alpha=0.3, linestyle='--')
        ax2.arrow(0, 0, transformed_vectors[0, i], transformed_vectors[1, i],
                 head_width=0.1, head_length=0.1, fc='red', ec='red',
                 alpha=0.7)

    # Draw eigenvectors
    for i, (val, vec) in enumerate(zip(eigenvals, eigenvecs.T)):
        length = 1.5
        ax2.arrow(0, 0, vec[0]*length, vec[1]*length,
                 head_width=0.1, head_length=0.1, fc=f'C{i+2}', ec=f'C{i+2}',
                 linewidth=3, label=f'Eigenvector{i+1}')

    ax2.set_xlim(-1, 4)
    ax2.set_ylim(-1, 3)
    ax2.grid(True, alpha=0.3)
    ax2.set_aspect('equal')
    ax2.legend()
    ax2.set_title('Transformed (Standard Basis)')

    # Representation in eigenvector basis
    P_inv = inv(P)
    coords_in_eigenbasis = P_inv @ test_vectors

    for i in range(test_vectors.shape[1]):
        ax3.arrow(0, 0, coords_in_eigenbasis[0, i], coords_in_eigenbasis[1, i],
                 head_width=0.1, head_length=0.1, fc='blue', ec='blue',
                 alpha=0.7)

    # Draw eigenvector basis (unit vectors in eigenvector coordinate system)
    ax3.arrow(0, 0, 1, 0, head_width=0.05, head_length=0.05,
             fc='purple', ec='purple', linewidth=2, label='Eigenbasis1')
    ax3.arrow(0, 0, 0, 1, head_width=0.05, head_length=0.05,
             fc='orange', ec='orange', linewidth=2, label='Eigenbasis2')

    ax3.set_xlim(-2, 2)
    ax3.set_ylim(-2, 2)
    ax3.grid(True, alpha=0.3)
    ax3.set_aspect('equal')
    ax3.legend()
    ax3.set_title('Eigenvector Coordinate System')

    # Second row: Transformation in eigenvector basis
    ax4, ax5, ax6 = axes[1]

    # Transformation in eigenvector basis (diagonal matrix action)
    transformed_coords = D @ coords_in_eigenbasis

    for i in range(test_vectors.shape[1]):
        ax4.arrow(0, 0, coords_in_eigenbasis[0, i], coords_in_eigenbasis[1, i],
                 head_width=0.1, head_length=0.1, fc='blue', ec='blue',
                 alpha=0.3, linestyle='--')
        ax4.arrow(0, 0, transformed_coords[0, i], transformed_coords[1, i],
                 head_width=0.1, head_length=0.1, fc='red', ec='red',
                 alpha=0.7)

    ax4.arrow(0, 0, 1, 0, head_width=0.05, head_length=0.05,
             fc='purple', ec='purple', linewidth=2)
    ax4.arrow(0, 0, 0, 1, head_width=0.05, head_length=0.05,
             fc='orange', ec='orange', linewidth=2)

    ax4.set_xlim(-2, 4)
    ax4.set_ylim(-2, 3)
    ax4.grid(True, alpha=0.3)
    ax4.set_aspect('equal')
    ax4.set_title(f'Transformation in Eigenbasis\\nD = diag({eigenvals[0]:.2f}, {eigenvals[1]:.2f})')

    # Display diagonalization decomposition
    ax5.text(0.1, 0.8, r'$A = PDP^{-1}$', fontsize=16, transform=ax5.transAxes)
    ax5.text(0.1, 0.6, r'$P = $ Eigenvector matrix', fontsize=12, transform=ax5.transAxes)
    ax5.text(0.1, 0.4, r'$D = $ Diagonal matrix', fontsize=12, transform=ax5.transAxes)
    ax5.text(0.1, 0.2, r'$P^{-1} = $ Coordinate transformation', fontsize=12, transform=ax5.transAxes)

    ax5.text(0.1, 0.1, f'P = \n{P}', fontsize=10, transform=ax5.transAxes,
             fontfamily='monospace')

    ax5.set_xlim(0, 1)
    ax5.set_ylim(0, 1)
    ax5.axis('off')
    ax5.set_title('Diagonalization Decomposition')

    # Transformation process diagram
    ax6.text(0.5, 0.9, 'Three Steps of Diagonalization:', fontsize=14, ha='center',
             transform=ax6.transAxes, weight='bold')

    steps = [
        '1. Standard basis → Eigenbasis',
        '   (multiply by P⁻¹)',
        '2. Scaling in eigenbasis',
        '   (multiply by D)',
        '3. Eigenbasis → Standard basis',
        '   (multiply by P)'
    ]

    for i, step in enumerate(steps):
        y_pos = 0.75 - i * 0.1
        color = 'blue' if i % 2 == 0 else 'gray'
        weight = 'bold' if i % 2 == 0 else 'normal'
        ax6.text(0.1, y_pos, step, fontsize=11, transform=ax6.transAxes,
                color=color, weight=weight)

    ax6.set_xlim(0, 1)
    ax6.set_ylim(0, 1)
    ax6.axis('off')
    ax6.set_title('Transformation Steps')

    plt.tight_layout()
    plt.show()

geometric_interpretation()

Application of Diagonalization: Matrix Powers

Fast Computation of Matrix Powers

If $A = PDP^{-1}$ , then: $A^n = PD^nP^{-1}$

This greatly simplifies the computation of matrix powers.

def matrix_power_application():
    """Application of matrix diagonalization in computing matrix powers"""

    # Define matrix
    A = np.array([[2, 1],
                  [1, 2]], dtype=float)

    print("Original matrix A:")
    print(A)

    # Diagonalize
    eigenvals, eigenvecs = eig(A)
    P = eigenvecs
    P_inv = inv(P)
    D = np.diag(eigenvals)

    print(f"\nDiagonalization: A = PDP^(-1)")
    print(f"P = \n{P}")
    print(f"D = \n{D}")

    # Calculate different powers
    powers = [2, 5, 10, 20]

    print(f"\nMatrix power calculation comparison:")
    print("="*60)

    for n in powers:
        # Method 1: Direct calculation (inefficient)
        A_power_direct = np.linalg.matrix_power(A, n)

        # Method 2: Using diagonalization (efficient)
        D_power = np.diag(eigenvals**n)
        A_power_diag = P @ D_power @ P_inv

        print(f"\nA^{n}:")
        print("Direct calculation:")
        print(A_power_direct)
        print("Diagonalization calculation:")
        print(A_power_diag)
        print(f"Error: {np.linalg.norm(A_power_direct - A_power_diag):.2e}")

    # Visualize eigenvalue power growth
    n_values = np.arange(1, 11)
    eigenval_powers = np.array([eigenvals**n for n in n_values])

    plt.figure(figsize=(12, 5))

    plt.subplot(1, 2, 1)
    for i, eigenval in enumerate(eigenvals):
        plt.plot(n_values, eigenval_powers[:, i], 'o-',
                label=f'λ{i+1} = {eigenval:.2f}', linewidth=2)

    plt.xlabel('n')
    plt.ylabel('λⁿ')
    plt.title('Powers of Eigenvalues')
    plt.legend()
    plt.grid(True, alpha=0.3)

    plt.subplot(1, 2, 2)
    for i, eigenval in enumerate(eigenvals):
        plt.semilogy(n_values, eigenval_powers[:, i], 'o-',
                    label=f'λ{i+1} = {eigenval:.2f}', linewidth=2)

    plt.xlabel('n')
    plt.ylabel('λⁿ (log scale)')
    plt.title('Powers of Eigenvalues (Log Scale)')
    plt.legend()
    plt.grid(True, alpha=0.3)

    plt.tight_layout()
    plt.show()

    # Fibonacci sequence application
    print(f"\nApplication case: Fibonacci sequence")
    print("Fibonacci recurrence can be written in matrix form:")
    print("[ F(n+1) ]   [ 1  1 ] [ F(n)   ]")
    print("[ F(n)   ] = [ 1  0 ] [ F(n-1) ]")

    fib_matrix = np.array([[1, 1],
                          [1, 0]], dtype=float)

    # Diagonalize Fibonacci matrix
    fib_eigenvals, fib_eigenvecs = eig(fib_matrix)
    fib_P = fib_eigenvecs
    fib_P_inv = inv(fib_P)

    print(f"\nEigenvalues of Fibonacci matrix: {fib_eigenvals}")
    print("These are the golden ratio φ and -1/φ!")

    phi = (1 + np.sqrt(5)) / 2
    print(f"Golden ratio φ = {phi:.6f}")
    print(f"Eigenvalue1 = {fib_eigenvals[0]:.6f}")
    print(f"Eigenvalue2 = {fib_eigenvals[1]:.6f}")

    # Calculate nth Fibonacci number
    def fibonacci_formula(n):
        """Calculate Fibonacci number using eigenvalue formula"""
        phi = (1 + np.sqrt(5)) / 2
        psi = (1 - np.sqrt(5)) / 2
        return int((phi**n - psi**n) / np.sqrt(5))

    print(f"\nFirst 15 Fibonacci numbers:")
    for i in range(1, 16):
        fib_n = fibonacci_formula(i)
        print(f"F({i}) = {fib_n}")

matrix_power_application()

Introduction to Jordan Canonical Form

Canonical Form for Non-Diagonalizable Matrices

Not all matrices are diagonalizable, but every matrix is similar to a Jordan canonical form matrix.

Structure of Jordan Blocks

A Jordan block has the following form:

Apache Airflow 3.x

Chapter 1: Introduction to Apache Airflow 3.x

Chapter 2: Core Concepts and Architecture

Chapter 3: Writing Your First DAG

Chapter 4: Built-in Operators and Sensors

Apache Airflow 3.x

Chapter 1: Introduction to Apache Airflow 3.x

Chapter 2: Core Concepts and Architecture

Chapter 3: Writing Your First DAG

Chapter 4: Built-in Operators and Sensors

Chapter 11: Matrix Diagonalization Theory

Chapter 11: Matrix Diagonalization Theory

Basic Concepts of Matrix Diagonalization

Definition

Equivalent Conditions for Diagonalization

Properties of Similar Matrices

Definition of Similar Matrices

Important Properties of Similar Matrices

Diagonalization Algorithm

Standard Diagonalization Steps

Geometric Meaning of Diagonalization

Coordinate Transformation Perspective

Application of Diagonalization: Matrix Powers

Fast Computation of Matrix Powers

Introduction to Jordan Canonical Form

Canonical Form for Non-Diagonalizable Matrices

Structure of Jordan Blocks