becked · December 6, 2025 23:24
diff --git a/old_world_rng_analysis_report.md b/old_world_rng_analysis_report.md
diff --git a/rng_correlation_test b/rng_correlation_test
 #!/usr/bin/env python3
 """
 Test for correlation between consecutive character seeds in Old World RNG.

 Reimplements the exact RNG algorithms from the game source:
 - NextAltSeed: LCG with multiplier 1103515245, increment 12345
 - NextSeed: Park-Miller variant with suspicious 64-bit/31-bit mismatch
 """

 from typing import Callable
 from collections import Counter
 import math

 # Constants from the game (Random.cs)
 IA = 16807
 IQ = 127773
 IR = 2836
 MOD_64 = 2**64


 class RandomStruct:
    """Exact reimplementation of Mohawk.SystemCore.RandomStruct"""

    def __init__(self, seed: int):
        self.seed = seed if seed != 0 else (2**64 - 1)

    def get_seed(self) -> int:
        return self.seed

    def set_seed(self, seed: int) -> None:
        self.seed = seed if seed != 0 else (2**64 - 1)

    def next_alt_seed(self) -> int:
        """LCG - used for getSeedForId"""
        self.seed = (self.seed * 1103515245 + 12345) % MOD_64
        return self.seed

    def next_seed(self) -> int:
        """Park-Miller variant - used for Next(), NextFloat(), etc."""
        k = self.seed // IQ
        # This can underflow in the original - Python handles big ints differently
        # We need to simulate 64-bit unsigned arithmetic
        result = IA * (self.seed - k * IQ) - IR * k
        # Simulate unsigned 64-bit wrap-around
        self.seed = result % MOD_64
        return self.seed

    @staticmethod
    def seed_to_int(seed: int, range_: int) -> int:
        """Convert seed to integer in [0, range)"""
        if range_ == 0:
            return 0
        return ((seed >> 16) % range_)

    def next(self, range_: int) -> int:
        """Get random int in [0, range)"""
        if range_ == 0:
            return 0
        return self.seed_to_int(self.next_seed(), range_)


 def get_seed_for_id(first_seed: int, char_id: int) -> int:
    """Reimplementation of Game.getSeedForId"""
    rng = RandomStruct(first_seed)
    for _ in range(char_id + 1):
        rng.next_alt_seed()
    return rng.get_seed()


 def simulate_courtier_archetype(initial_seed: int, die_size: int = 50) -> int:
    """
    Simulate the RNG path to archetype selection.

    In generateRatingsCourtier:
    1. randomNext(3) for rating - advances RNG via NextSeed
    2. nextRandomSeed() for archetype seed - advances RNG via NextSeed
    3. randomDieMap creates new RNG with that seed, calls Next(die_size)
    """
    rng = RandomStruct(initial_seed)

    # Step 1: Rating roll (randomNext calls Next which calls NextSeed)
    rng.next(3)  # Advances internal state

    # Step 2: Get seed for archetype (nextRandomSeed calls NextSeed)
    archetype_seed = rng.next_seed()

    # Step 3: randomDieMap creates fresh RNG and calls Next
    die_rng = RandomStruct(archetype_seed)
    roll = die_rng.next(die_size)

    return roll


 def test_consecutive_correlation(first_seed: int, num_pairs: int = 10000) -> dict:
    """Test correlation between consecutive character archetype rolls."""

    results = []

    for char_id in range(num_pairs):
        seed_a = get_seed_for_id(first_seed, char_id)
        seed_b = get_seed_for_id(first_seed, char_id + 1)

        roll_a = simulate_courtier_archetype(seed_a)
        roll_b = simulate_courtier_archetype(seed_b)

        # For 5 archetypes with weight 10 each, die_size=50
        # Archetype index = roll // 10
        arch_a = roll_a // 10
        arch_b = roll_b // 10

        results.append((arch_a, arch_b))

    return analyze_correlation(results)


 def analyze_correlation(pairs: list[tuple[int, int]]) -> dict:
    """Analyze correlation between paired results."""

    n = len(pairs)

    # Count exact matches
    matches = sum(1 for a, b in pairs if a == b)
    match_rate = matches / n
    expected_match_rate = 1/5  # 5 archetypes, uniform

    # Count each archetype for both positions
    first_counts = Counter(a for a, b in pairs)
    second_counts = Counter(b for a, b in pairs)

    # Chi-square for independence
    # Build contingency table
    contingency = {}
    for a, b in pairs:
        contingency[(a, b)] = contingency.get((a, b), 0) + 1

    # Calculate chi-square statistic
    chi_sq = 0
    for a in range(5):
        for b in range(5):
            observed = contingency.get((a, b), 0)
            expected = (first_counts[a] / n) * (second_counts[b] / n) * n
            if expected > 0:
                chi_sq += (observed - expected) ** 2 / expected

    # Degrees of freedom = (5-1) * (5-1) = 16
    # Critical value at p=0.05 is ~26.3
    # Critical value at p=0.01 is ~32.0

    return {
        'num_pairs': n,
        'matches': matches,
        'match_rate': match_rate,
        'expected_match_rate': expected_match_rate,
        'match_rate_ratio': match_rate / expected_match_rate,
        'chi_square': chi_sq,
        'chi_sq_critical_0.05': 26.296,
        'chi_sq_critical_0.01': 32.000,
        'independent': chi_sq < 26.296,
        'first_distribution': dict(first_counts),
        'second_distribution': dict(second_counts),
        'contingency_sample': {k: v for k, v in list(contingency.items())[:10]}
    }


 def test_raw_seed_correlation(first_seed: int, num_pairs: int = 10000) -> dict:
    """Test if consecutive LCG seeds produce correlated Park-Miller outputs."""

    correlations = []

    for char_id in range(num_pairs):
        seed_a = get_seed_for_id(first_seed, char_id)
        seed_b = get_seed_for_id(first_seed, char_id + 1)  # = LCG(seed_a)

        # Apply same number of Park-Miller steps
        rng_a = RandomStruct(seed_a)
        rng_b = RandomStruct(seed_b)

        # 3 PM steps (rating + archetype seed + die roll)
        for _ in range(3):
            rng_a.next_seed()
            rng_b.next_seed()

        # Compare final seeds
        final_a = rng_a.get_seed()
        final_b = rng_b.get_seed()

        # Check various bit positions
        correlations.append({
            'xor_popcount': bin(final_a ^ final_b).count('1'),
            'high_16_match': (final_a >> 48) == (final_b >> 48),
            'final_a': final_a,
            'final_b': final_b,
        })

    avg_xor_bits = sum(c['xor_popcount'] for c in correlations) / num_pairs
    high_matches = sum(1 for c in correlations if c['high_16_match']) / num_pairs

    return {
        'avg_xor_bit_diff': avg_xor_bits,
        'expected_xor_bits': 32,  # For independent 64-bit values
        'high_16_match_rate': high_matches,
        'expected_high_16_match': 1 / 65536,
    }


 def main():
    print("=" * 70)
    print("OLD WORLD RNG CORRELATION TEST")
    print("=" * 70)

    # Test with a few different first seeds
    test_seeds = [12345, 98765432, 0xDEADBEEF, 1]

    for first_seed in test_seeds:
        print(f"\n{'=' * 70}")
        print(f"Testing with FirstSeed = {first_seed} (0x{first_seed:X})")
        print("=" * 70)

        # Test 1: Archetype correlation
        print("\n[Test 1: Consecutive Character Archetype Correlation]")
        result = test_consecutive_correlation(first_seed, num_pairs=10000)

        print(f"  Pairs tested: {result['num_pairs']}")
        print(f"  Exact matches: {result['matches']}")
        print(f"  Match rate: {result['match_rate']:.4f} (expected: {result['expected_match_rate']:.4f})")
        print(f"  Ratio to expected: {result['match_rate_ratio']:.4f}x")
        print(f"  Chi-square: {result['chi_square']:.2f} (critical @0.05: {result['chi_sq_critical_0.05']:.2f})")
        print(f"  Independent: {result['independent']}")
        print(f"  First char distribution: {result['first_distribution']}")
        print(f"  Second char distribution: {result['second_distribution']}")

        # Test 2: Raw seed correlation
        print("\n[Test 2: Raw Seed Bit Correlation After Park-Miller]")
        raw_result = test_raw_seed_correlation(first_seed, num_pairs=10000)

        print(f"  Avg XOR bit difference: {raw_result['avg_xor_bit_diff']:.2f} (expected ~32 for independent)")
        print(f"  High 16-bit match rate: {raw_result['high_16_match_rate']:.6f} (expected ~{raw_result['expected_high_16_match']:.6f})")

    print("\n" + "=" * 70)
    print("INTERPRETATION")
    print("=" * 70)
    print("""
 If consecutive characters were correlated:
 - Match rate would be significantly higher than 20%
 - Chi-square would exceed critical value (26.3)
 - XOR bit difference would be significantly less than 32

 If independent:
 - Match rate ≈ 20% (±~1% for 10k samples)
 - Chi-square < 26.3
 - XOR bit difference ≈ 32
 """)


 if __name__ == "__main__":
    main()
diff --git a/rng_deep_analysis b/rng_deep_analysis
 #!/usr/bin/env python3
 """
 Deep analysis of WHERE the correlation exists and how it's masked.
 """

 MOD_64 = 2**64
 IA = 16807
 IQ = 127773
 IR = 2836


 class RandomStruct:
    def __init__(self, seed: int):
        self.seed = seed if seed != 0 else (2**64 - 1)

    def get_seed(self) -> int:
        return self.seed

    def next_alt_seed(self) -> int:
        self.seed = (self.seed * 1103515245 + 12345) % MOD_64
        return self.seed

    def next_seed(self) -> int:
        k = self.seed // IQ
        result = IA * (self.seed - k * IQ) - IR * k
        self.seed = result % MOD_64
        return self.seed

    @staticmethod
    def seed_to_int(seed: int, range_: int) -> int:
        if range_ == 0:
            return 0
        return ((seed >> 16) % range_)

    def next(self, range_: int) -> int:
        if range_ == 0:
            return 0
        return self.seed_to_int(self.next_seed(), range_)


 def get_seed_for_id(first_seed: int, char_id: int) -> int:
    rng = RandomStruct(first_seed)
    for _ in range(char_id + 1):
        rng.next_alt_seed()
    return rng.get_seed()


 def analyze_bit_patterns(first_seed: int, num_pairs: int = 1000):
    """Analyze which bits are correlated at each step."""

    print(f"\n{'='*70}")
    print(f"BIT-LEVEL CORRELATION ANALYSIS (FirstSeed={first_seed})")
    print('='*70)

    # Track correlation at each PM step
    for pm_steps in [0, 1, 2, 3]:
        bit_same_count = [0] * 64

        for char_id in range(num_pairs):
            seed_a = get_seed_for_id(first_seed, char_id)
            seed_b = get_seed_for_id(first_seed, char_id + 1)

            rng_a = RandomStruct(seed_a)
            rng_b = RandomStruct(seed_b)

            for _ in range(pm_steps):
                rng_a.next_seed()
                rng_b.next_seed()

            final_a = rng_a.get_seed()
            final_b = rng_b.get_seed()

            # Check each bit position
            for bit in range(64):
                bit_a = (final_a >> bit) & 1
                bit_b = (final_b >> bit) & 1
                if bit_a == bit_b:
                    bit_same_count[bit] += 1

        # Report
        print(f"\nAfter {pm_steps} Park-Miller steps:")
        print("  Bit positions where consecutive seeds match (% of pairs):")
        print("  High bits (48-63): ", end="")
        for bit in range(63, 47, -1):
            pct = bit_same_count[bit] / num_pairs * 100
            print(f"{pct:.0f}% ", end="")
        print()
        print("  Mid bits (32-47):  ", end="")
        for bit in range(47, 31, -1):
            pct = bit_same_count[bit] / num_pairs * 100
            print(f"{pct:.0f}% ", end="")
        print()
        print("  Mid bits (16-31):  ", end="")
        for bit in range(31, 15, -1):
            pct = bit_same_count[bit] / num_pairs * 100
            print(f"{pct:.0f}% ", end="")
        print()
        print("  Low bits (0-15):   ", end="")
        for bit in range(15, -1, -1):
            pct = bit_same_count[bit] / num_pairs * 100
            print(f"{pct:.0f}% ", end="")
        print()


 def analyze_seed_to_int_effect(first_seed: int, num_pairs: int = 10000):
    """See how SeedToInt transforms correlated seeds."""

    print(f"\n{'='*70}")
    print("SEED_TO_INT TRANSFORMATION ANALYSIS")
    print('='*70)

    for die_size in [50, 100, 5, 3]:
        same_result = 0

        for char_id in range(num_pairs):
            seed_a = get_seed_for_id(first_seed, char_id)
            seed_b = get_seed_for_id(first_seed, char_id + 1)

            # Apply 3 PM steps (like courtier generation)
            rng_a = RandomStruct(seed_a)
            rng_b = RandomStruct(seed_b)
            for _ in range(3):
                rng_a.next_seed()
                rng_b.next_seed()

            final_a = rng_a.get_seed()
            final_b = rng_b.get_seed()

            # Apply SeedToInt
            result_a = RandomStruct.seed_to_int(final_a, die_size)
            result_b = RandomStruct.seed_to_int(final_b, die_size)

            if result_a == result_b:
                same_result += 1

        expected = 1 / die_size
        actual = same_result / num_pairs
        print(f"\n  Die size {die_size}:")
        print(f"    Same result rate: {actual:.4f} (expected for independent: {expected:.4f})")
        print(f"    Ratio: {actual/expected:.2f}x")


 def trace_single_pair(first_seed: int, char_id: int):
    """Trace through one pair in detail."""

    print(f"\n{'='*70}")
    print(f"DETAILED TRACE: Characters {char_id} and {char_id+1}")
    print('='*70)

    seed_a = get_seed_for_id(first_seed, char_id)
    seed_b = get_seed_for_id(first_seed, char_id + 1)

    print(f"\nInitial seeds (from LCG):")
    print(f"  Char {char_id}:   0x{seed_a:016X}")
    print(f"  Char {char_id+1}: 0x{seed_b:016X}")
    print(f"  XOR:         0x{seed_a ^ seed_b:016X}")
    print(f"  XOR popcount: {bin(seed_a ^ seed_b).count('1')} bits differ")

    rng_a = RandomStruct(seed_a)
    rng_b = RandomStruct(seed_b)

    for step in range(4):
        rng_a.next_seed()
        rng_b.next_seed()
        sa = rng_a.get_seed()
        sb = rng_b.get_seed()

        print(f"\nAfter PM step {step+1}:")
        print(f"  Char {char_id}:   0x{sa:016X}")
        print(f"  Char {char_id+1}: 0x{sb:016X}")
        print(f"  XOR:         0x{sa ^ sb:016X}")
        print(f"  XOR popcount: {bin(sa ^ sb).count('1')} bits differ")

        # Show what SeedToInt would produce
        for die_size in [50, 5]:
            res_a = RandomStruct.seed_to_int(sa, die_size)
            res_b = RandomStruct.seed_to_int(sb, die_size)
            print(f"  SeedToInt({die_size}): {res_a} vs {res_b} {'(SAME)' if res_a == res_b else ''}")


 def check_park_miller_behavior():
    """Check if the PM implementation behaves as expected."""

    print(f"\n{'='*70}")
    print("PARK-MILLER IMPLEMENTATION CHECK")
    print('='*70)

    # Test with values that might cause underflow
    test_seeds = [
        1,
        IQ - 1,  # 127772
        IQ,      # 127773
        IQ + 1,  # 127774
        IQ * 2,
        2**31 - 1,  # Original PM modulus
        2**32,
        2**48,
        2**63,
        2**64 - 1,
    ]

    for seed in test_seeds:
        rng = RandomStruct(seed)
        next_val = rng.next_seed()

        # Check if underflow occurred (result wrapped around)
        k = seed // IQ
        raw_result = IA * (seed - k * IQ) - IR * k

        print(f"\n  Seed: {seed:>20} (0x{seed:016X})")
        print(f"    k = seed // IQ = {k}")
        print(f"    Raw result (before mod): {raw_result}")
        print(f"    After mod 2^64: {next_val} (0x{next_val:016X})")
        if raw_result < 0:
            print(f"    *** UNDERFLOW OCCURRED ***")


 def main():
    first_seed = 12345

    # Check PM behavior first
    check_park_miller_behavior()

    # Analyze bit patterns
    analyze_bit_patterns(first_seed, num_pairs=1000)

    # Analyze SeedToInt effect
    analyze_seed_to_int_effect(first_seed, num_pairs=10000)

    # Trace a specific pair
    trace_single_pair(first_seed, char_id=100)


 if __name__ == "__main__":
    main()
Die Size	Same Result Rate	Expected (Independent)	Ratio
50	2.06%	2.00%	1.03x
100	1.04%	1.00%	1.04x
5	20.02%	20.00%	1.00x
3	32.99%	33.33%	0.99x
FirstSeed	Chi-Square	Critical Value (p=0.05)	Independent?
12345	25.72	26.30	Yes
98765432	12.89	26.30	Yes
0xDEADBEEF	19.48	26.30	Yes
1	15.50	26.30	Yes
Attribute	Options	Match Probability
Archetype	5 (equal weight)	20%
Adjective	10 (equal weight)	10%
Discipline Rating	3 values (2, 3, or 4)	33%
Traits only	5 × 10	2%
Full match	5 × 10 × 3	0.67%
	#!/usr/bin/env python3
	"""
	Test for correlation between consecutive character seeds in Old World RNG.

	Reimplements the exact RNG algorithms from the game source:
	- NextAltSeed: LCG with multiplier 1103515245, increment 12345
	- NextSeed: Park-Miller variant with suspicious 64-bit/31-bit mismatch
	"""

	from typing import Callable
	from collections import Counter
	import math

	# Constants from the game (Random.cs)
	IA = 16807
	IQ = 127773
	IR = 2836
	MOD_64 = 2**64


	class RandomStruct:
	"""Exact reimplementation of Mohawk.SystemCore.RandomStruct"""

	def __init__(self, seed: int):
	self.seed = seed if seed != 0 else (2**64 - 1)

	def get_seed(self) -> int:
	return self.seed

	def set_seed(self, seed: int) -> None:
	self.seed = seed if seed != 0 else (2**64 - 1)

	def next_alt_seed(self) -> int:
	"""LCG - used for getSeedForId"""
	self.seed = (self.seed * 1103515245 + 12345) % MOD_64
	return self.seed

	def next_seed(self) -> int:
	"""Park-Miller variant - used for Next(), NextFloat(), etc."""
	k = self.seed // IQ
	# This can underflow in the original - Python handles big ints differently
	# We need to simulate 64-bit unsigned arithmetic
	result = IA * (self.seed - k * IQ) - IR * k
	# Simulate unsigned 64-bit wrap-around
	self.seed = result % MOD_64
	return self.seed

	@staticmethod
	def seed_to_int(seed: int, range_: int) -> int:
	"""Convert seed to integer in [0, range)"""
	if range_ == 0:
	return 0
	return ((seed >> 16) % range_)

	def next(self, range_: int) -> int:
	"""Get random int in [0, range)"""
	if range_ == 0:
	return 0
	return self.seed_to_int(self.next_seed(), range_)


	def get_seed_for_id(first_seed: int, char_id: int) -> int:
	"""Reimplementation of Game.getSeedForId"""
	rng = RandomStruct(first_seed)
	for _ in range(char_id + 1):
	rng.next_alt_seed()
	return rng.get_seed()


	def simulate_courtier_archetype(initial_seed: int, die_size: int = 50) -> int:
	"""
	Simulate the RNG path to archetype selection.

	In generateRatingsCourtier:
	1. randomNext(3) for rating - advances RNG via NextSeed
	2. nextRandomSeed() for archetype seed - advances RNG via NextSeed
	3. randomDieMap creates new RNG with that seed, calls Next(die_size)
	"""
	rng = RandomStruct(initial_seed)

	# Step 1: Rating roll (randomNext calls Next which calls NextSeed)
	rng.next(3) # Advances internal state

	# Step 2: Get seed for archetype (nextRandomSeed calls NextSeed)
	archetype_seed = rng.next_seed()

	# Step 3: randomDieMap creates fresh RNG and calls Next
	die_rng = RandomStruct(archetype_seed)
	roll = die_rng.next(die_size)

	return roll


	def test_consecutive_correlation(first_seed: int, num_pairs: int = 10000) -> dict:
	"""Test correlation between consecutive character archetype rolls."""

	results = []

	for char_id in range(num_pairs):
	seed_a = get_seed_for_id(first_seed, char_id)
	seed_b = get_seed_for_id(first_seed, char_id + 1)

	roll_a = simulate_courtier_archetype(seed_a)
	roll_b = simulate_courtier_archetype(seed_b)

	# For 5 archetypes with weight 10 each, die_size=50
	# Archetype index = roll // 10
	arch_a = roll_a // 10
	arch_b = roll_b // 10

	results.append((arch_a, arch_b))

	return analyze_correlation(results)


	def analyze_correlation(pairs: list[tuple[int, int]]) -> dict:
	"""Analyze correlation between paired results."""

	n = len(pairs)

	# Count exact matches
	matches = sum(1 for a, b in pairs if a == b)
	match_rate = matches / n
	expected_match_rate = 1/5 # 5 archetypes, uniform

	# Count each archetype for both positions
	first_counts = Counter(a for a, b in pairs)
	second_counts = Counter(b for a, b in pairs)

	# Chi-square for independence
	# Build contingency table
	contingency = {}
	for a, b in pairs:
	contingency[(a, b)] = contingency.get((a, b), 0) + 1

	# Calculate chi-square statistic
	chi_sq = 0
	for a in range(5):
	for b in range(5):
	observed = contingency.get((a, b), 0)
	expected = (first_counts[a] / n) * (second_counts[b] / n) * n
	if expected > 0:
	chi_sq += (observed - expected) ** 2 / expected

	# Degrees of freedom = (5-1) * (5-1) = 16
	# Critical value at p=0.05 is ~26.3
	# Critical value at p=0.01 is ~32.0

	return {
	'num_pairs': n,
	'matches': matches,
	'match_rate': match_rate,
	'expected_match_rate': expected_match_rate,
	'match_rate_ratio': match_rate / expected_match_rate,
	'chi_square': chi_sq,
	'chi_sq_critical_0.05': 26.296,
	'chi_sq_critical_0.01': 32.000,
	'independent': chi_sq < 26.296,
	'first_distribution': dict(first_counts),
	'second_distribution': dict(second_counts),
	'contingency_sample': {k: v for k, v in list(contingency.items())[:10]}
	}


	def test_raw_seed_correlation(first_seed: int, num_pairs: int = 10000) -> dict:
	"""Test if consecutive LCG seeds produce correlated Park-Miller outputs."""

	correlations = []

	for char_id in range(num_pairs):
	seed_a = get_seed_for_id(first_seed, char_id)
	seed_b = get_seed_for_id(first_seed, char_id + 1) # = LCG(seed_a)

	# Apply same number of Park-Miller steps
	rng_a = RandomStruct(seed_a)
	rng_b = RandomStruct(seed_b)

	# 3 PM steps (rating + archetype seed + die roll)
	for _ in range(3):
	rng_a.next_seed()
	rng_b.next_seed()

	# Compare final seeds
	final_a = rng_a.get_seed()
	final_b = rng_b.get_seed()

	# Check various bit positions
	correlations.append({
	'xor_popcount': bin(final_a ^ final_b).count('1'),
	'high_16_match': (final_a >> 48) == (final_b >> 48),
	'final_a': final_a,
	'final_b': final_b,
	})

	avg_xor_bits = sum(c['xor_popcount'] for c in correlations) / num_pairs
	high_matches = sum(1 for c in correlations if c['high_16_match']) / num_pairs

	return {
	'avg_xor_bit_diff': avg_xor_bits,
	'expected_xor_bits': 32, # For independent 64-bit values
	'high_16_match_rate': high_matches,
	'expected_high_16_match': 1 / 65536,
	}


	def main():
	print("=" * 70)
	print("OLD WORLD RNG CORRELATION TEST")
	print("=" * 70)

	# Test with a few different first seeds
	test_seeds = [12345, 98765432, 0xDEADBEEF, 1]

	for first_seed in test_seeds:
	print(f"\n{'=' * 70}")
	print(f"Testing with FirstSeed = {first_seed} (0x{first_seed:X})")
	print("=" * 70)

	# Test 1: Archetype correlation
	print("\n[Test 1: Consecutive Character Archetype Correlation]")
	result = test_consecutive_correlation(first_seed, num_pairs=10000)

	print(f" Pairs tested: {result['num_pairs']}")
	print(f" Exact matches: {result['matches']}")
	print(f" Match rate: {result['match_rate']:.4f} (expected: {result['expected_match_rate']:.4f})")
	print(f" Ratio to expected: {result['match_rate_ratio']:.4f}x")
	print(f" Chi-square: {result['chi_square']:.2f} (critical @0.05: {result['chi_sq_critical_0.05']:.2f})")
	print(f" Independent: {result['independent']}")
	print(f" First char distribution: {result['first_distribution']}")
	print(f" Second char distribution: {result['second_distribution']}")

	# Test 2: Raw seed correlation
	print("\n[Test 2: Raw Seed Bit Correlation After Park-Miller]")
	raw_result = test_raw_seed_correlation(first_seed, num_pairs=10000)

	print(f" Avg XOR bit difference: {raw_result['avg_xor_bit_diff']:.2f} (expected ~32 for independent)")
	print(f" High 16-bit match rate: {raw_result['high_16_match_rate']:.6f} (expected ~{raw_result['expected_high_16_match']:.6f})")

	print("\n" + "=" * 70)
	print("INTERPRETATION")
	print("=" * 70)
	print("""
	If consecutive characters were correlated:
	- Match rate would be significantly higher than 20%
	- Chi-square would exceed critical value (26.3)
	- XOR bit difference would be significantly less than 32

	If independent:
	- Match rate ≈ 20% (±~1% for 10k samples)
	- Chi-square < 26.3
	- XOR bit difference ≈ 32
	""")


	if __name__ == "__main__":
	main()
	#!/usr/bin/env python3
	"""
	Deep analysis of WHERE the correlation exists and how it's masked.
	"""

	MOD_64 = 2**64
	IA = 16807
	IQ = 127773
	IR = 2836


	class RandomStruct:
	def __init__(self, seed: int):
	self.seed = seed if seed != 0 else (2**64 - 1)

	def get_seed(self) -> int:
	return self.seed

	def next_alt_seed(self) -> int:
	self.seed = (self.seed * 1103515245 + 12345) % MOD_64
	return self.seed

	def next_seed(self) -> int:
	k = self.seed // IQ
	result = IA * (self.seed - k * IQ) - IR * k
	self.seed = result % MOD_64
	return self.seed

	@staticmethod
	def seed_to_int(seed: int, range_: int) -> int:
	if range_ == 0:
	return 0
	return ((seed >> 16) % range_)

	def next(self, range_: int) -> int:
	if range_ == 0:
	return 0
	return self.seed_to_int(self.next_seed(), range_)


	def get_seed_for_id(first_seed: int, char_id: int) -> int:
	rng = RandomStruct(first_seed)
	for _ in range(char_id + 1):
	rng.next_alt_seed()
	return rng.get_seed()


	def analyze_bit_patterns(first_seed: int, num_pairs: int = 1000):
	"""Analyze which bits are correlated at each step."""

	print(f"\n{'='*70}")
	print(f"BIT-LEVEL CORRELATION ANALYSIS (FirstSeed={first_seed})")
	print('='*70)

	# Track correlation at each PM step
	for pm_steps in [0, 1, 2, 3]:
	bit_same_count = [0] * 64

	for char_id in range(num_pairs):
	seed_a = get_seed_for_id(first_seed, char_id)
	seed_b = get_seed_for_id(first_seed, char_id + 1)

	rng_a = RandomStruct(seed_a)
	rng_b = RandomStruct(seed_b)

	for _ in range(pm_steps):
	rng_a.next_seed()
	rng_b.next_seed()

	final_a = rng_a.get_seed()
	final_b = rng_b.get_seed()

	# Check each bit position
	for bit in range(64):
	bit_a = (final_a >> bit) & 1
	bit_b = (final_b >> bit) & 1
	if bit_a == bit_b:
	bit_same_count[bit] += 1

	# Report
	print(f"\nAfter {pm_steps} Park-Miller steps:")
	print(" Bit positions where consecutive seeds match (% of pairs):")
	print(" High bits (48-63): ", end="")
	for bit in range(63, 47, -1):
	pct = bit_same_count[bit] / num_pairs * 100
	print(f"{pct:.0f}% ", end="")
	print()
	print(" Mid bits (32-47): ", end="")
	for bit in range(47, 31, -1):
	pct = bit_same_count[bit] / num_pairs * 100
	print(f"{pct:.0f}% ", end="")
	print()
	print(" Mid bits (16-31): ", end="")
	for bit in range(31, 15, -1):
	pct = bit_same_count[bit] / num_pairs * 100
	print(f"{pct:.0f}% ", end="")
	print()
	print(" Low bits (0-15): ", end="")
	for bit in range(15, -1, -1):
	pct = bit_same_count[bit] / num_pairs * 100
	print(f"{pct:.0f}% ", end="")
	print()


	def analyze_seed_to_int_effect(first_seed: int, num_pairs: int = 10000):
	"""See how SeedToInt transforms correlated seeds."""

	print(f"\n{'='*70}")
	print("SEED_TO_INT TRANSFORMATION ANALYSIS")
	print('='*70)

	for die_size in [50, 100, 5, 3]:
	same_result = 0

	for char_id in range(num_pairs):
	seed_a = get_seed_for_id(first_seed, char_id)
	seed_b = get_seed_for_id(first_seed, char_id + 1)

	# Apply 3 PM steps (like courtier generation)
	rng_a = RandomStruct(seed_a)
	rng_b = RandomStruct(seed_b)
	for _ in range(3):
	rng_a.next_seed()
	rng_b.next_seed()

	final_a = rng_a.get_seed()
	final_b = rng_b.get_seed()

	# Apply SeedToInt
	result_a = RandomStruct.seed_to_int(final_a, die_size)
	result_b = RandomStruct.seed_to_int(final_b, die_size)

	if result_a == result_b:
	same_result += 1

	expected = 1 / die_size
	actual = same_result / num_pairs
	print(f"\n Die size {die_size}:")
	print(f" Same result rate: {actual:.4f} (expected for independent: {expected:.4f})")
	print(f" Ratio: {actual/expected:.2f}x")


	def trace_single_pair(first_seed: int, char_id: int):
	"""Trace through one pair in detail."""

	print(f"\n{'='*70}")
	print(f"DETAILED TRACE: Characters {char_id} and {char_id+1}")
	print('='*70)

	seed_a = get_seed_for_id(first_seed, char_id)
	seed_b = get_seed_for_id(first_seed, char_id + 1)

	print(f"\nInitial seeds (from LCG):")
	print(f" Char {char_id}: 0x{seed_a:016X}")
	print(f" Char {char_id+1}: 0x{seed_b:016X}")
	print(f" XOR: 0x{seed_a ^ seed_b:016X}")
	print(f" XOR popcount: {bin(seed_a ^ seed_b).count('1')} bits differ")

	rng_a = RandomStruct(seed_a)
	rng_b = RandomStruct(seed_b)

	for step in range(4):
	rng_a.next_seed()
	rng_b.next_seed()
	sa = rng_a.get_seed()
	sb = rng_b.get_seed()

	print(f"\nAfter PM step {step+1}:")
	print(f" Char {char_id}: 0x{sa:016X}")
	print(f" Char {char_id+1}: 0x{sb:016X}")
	print(f" XOR: 0x{sa ^ sb:016X}")
	print(f" XOR popcount: {bin(sa ^ sb).count('1')} bits differ")

	# Show what SeedToInt would produce
	for die_size in [50, 5]:
	res_a = RandomStruct.seed_to_int(sa, die_size)
	res_b = RandomStruct.seed_to_int(sb, die_size)
	print(f" SeedToInt({die_size}): {res_a} vs {res_b} {'(SAME)' if res_a == res_b else ''}")


	def check_park_miller_behavior():
	"""Check if the PM implementation behaves as expected."""

	print(f"\n{'='*70}")
	print("PARK-MILLER IMPLEMENTATION CHECK")
	print('='*70)

	# Test with values that might cause underflow
	test_seeds = [
	1,
	IQ - 1, # 127772
	IQ, # 127773
	IQ + 1, # 127774
	IQ * 2,
	2**31 - 1, # Original PM modulus
	2**32,
	2**48,
	2**63,
	2**64 - 1,
	]

	for seed in test_seeds:
	rng = RandomStruct(seed)
	next_val = rng.next_seed()

	# Check if underflow occurred (result wrapped around)
	k = seed // IQ
	raw_result = IA * (seed - k * IQ) - IR * k

	print(f"\n Seed: {seed:>20} (0x{seed:016X})")
	print(f" k = seed // IQ = {k}")
	print(f" Raw result (before mod): {raw_result}")
	print(f" After mod 2^64: {next_val} (0x{next_val:016X})")
	if raw_result < 0:
	print(f" * UNDERFLOW OCCURRED *")


	def main():
	first_seed = 12345

	# Check PM behavior first
	check_park_miller_behavior()

	# Analyze bit patterns
	analyze_bit_patterns(first_seed, num_pairs=1000)

	# Analyze SeedToInt effect
	analyze_seed_to_int_effect(first_seed, num_pairs=10000)

	# Trace a specific pair
	trace_single_pair(first_seed, char_id=100)


	if __name__ == "__main__":
	main()