【検討】Izu trail journey 2021
- やったこと
- ヒストグラム
- サブXXするための指標
- 宝蔵院までのタイムと総合タイムは最も相関が低い
- 走力に自身がないのであればスタートダッシュはしない方が良い
- 統計学的には渋滞はタイムに影響したとはいえない
やったこと
ITJ 2021の結果 (総合タイム, 各エイドの通過時間) が公式サイトにて公開されているので、男性データを読み込み、さまざまな検討をした。
Seg1: スタート (松崎新港) ~ 宝蔵院
Seg2: 宝蔵院 ~ こがね橋
Seg3: こがね橋 ~ 仁科峠
Seg4: 仁科峠 ~ 土肥駐車場
Seg5: 土肥駐車場 ~ ゴール (修善寺総合会館)
Time: 総合タイム
Nihsina: 仁科峠までの時間
overN: 仁科峠以降の時間
ヒストグラム
Shapiro-Wilk normality test
data: DB_result$Time
W = 0.975, p-value = 1.307e-12
⇒ 正規分布には従わない
中央値は670分、平均値は663分、上位25% ~ 75%の選手は588分 ~ 749分の範囲に入っているということが分かりました。
サブXXするための指標
サブ6
上田選手、マジで人外ですね……蓋を開けてみたら堂々の圧勝。かっこよすぎます。
サブ7
実質的な関門を知るために、ゴールタイムが6時間~6時間59分59秒の集団について、各セクションの最も遅いタイムについて検討。
Houzou Kogane Nishina Toi Shuzenji
51.78 140.97 240.92 320.18 418.45
⇒ 最も遅い人でも宝蔵院に52分弱で付いており、仁科峠には4時間で到着している
(なお、この解析を行うのは、上記集団の中で最も遅かった人物 = 各エイドに最も遅く到達した人物では必ずしもない為です)
ゴールタイムが6時間50分~6時間59分59秒の集団について検討。
平均値
Seg1 Seg2 Seg3 Seg4 Seg5 Time Nishina overN
49.59 84.73 97.62 81.85 101.73 415.53 231.95 183.58Houzou Kogane Nishina Toi Shuzenji
49.59 134.32 231.95 313.80 415.53
以下、同様の検討を行っていきます。
サブ8
実質的な関門
Houzou Kogane Nishina Toi Shuzenji
57.75 157.65 272.85 367.43 479.08
ギリギリでゴールした集団の平均値
Seg1 Seg2 Seg3 Seg4 Seg5 Time Nishina overN
55.73 95.17 115.89 95.89 112.45 475.12 266.78 208.34Houzou Kogane Nishina Toi Shuzenji
55.73 150.90 266.78 362.67 475.12
サブ9
実質的な関門
Houzou Kogane Nishina Toi Shuzenji
72.42 182.08 315.32 421.63 539.88
ギリギリでゴールした集団の平均値
Seg1 Seg2 Seg3 Seg4 Seg5 Time Nishina overN
64.13 105.06 131.58 108.90 126.20 535.88 300.77 235.11Houzou Kogane Nishina Toi Shuzenji
64.13 169.19 300.77 409.67 535.88
サブ10
実質的な関門
Houzou Kogane Nishina Toi Shuzenji
85.93 211.67 356.78 471.02 599.50
ギリギリ集団の平均値
Seg1 Seg2 Seg3 Seg4 Seg5 Time Nishina overN
69.64 115.47 147.98 120.67 141.02 594.79 333.09 261.69Houzou Kogane Nishina Toi Shuzenji
69.64 185.11 333.09 453.77 594.79
サブ12
関門
Houzou Kogane Nishina Toi Shuzenji
98.62 236.17 413.85 555.62 719.55
ギリギリ集団の平均値
Seg1 Seg2 Seg3 Seg4 Seg5 Time Nishina overN
82.87 133.14 172.90 149.16 177.88 715.94 388.91 327.03Houzou Kogane Nishina Toi Shuzenji
82.87 216.01 388.91 538.06 715.94
サブ14 (=なんとか完走)
関門
Houzou Kogane Nishina Toi Shuzenji
101.20 275.58 487.10 657.53 839.37
ギリギリ集団の平均値
Seg1 Seg2 Seg3 Seg4 Seg5 Time Nishina overN
92.32 152.81 207.22 176.12 205.74 834.21 452.35 381.87Houzou Kogane Nishina Toi Shuzenji
92.32 245.13 452.35 628.47 834.21
宝蔵院までのタイムと総合タイムは最も相関が低い
やったこと: 各セグメントのタイムと総合タイムの相関係数について計算した。
予想通りといえば予想通りですが、序盤を飛ばし過ぎても総合タイムにはそこまで寄与しない、ということのようです。宝蔵院までのルートはほぼコンクリで、斜度もそこまで高くなく、下りがまったくないので走力を純粋に反映する区間であり、総合タイムを予測する指標として適するハズですが、序盤のハイテンションやさまざまな作戦等が反映されてこのような結果になったと推察します。
走力に自身がないのであればスタートダッシュはしない方が良い
やったこと: 上位5%でゴールした選手と下位5%でゴールした選手の比較検討を行った。
上記図において、x軸が宝蔵院までのタイム、y軸が総合タイムとなります。ここから分かるのは、上位5 %の選手については宝蔵院までのタイムが総合タイムの良い指標となるが、下位5%の選手についてはほぼほぼ関係がないということです。
今度はY軸を土肥駐車場~修善寺総合会館までのタイムとしてみました。
#上位集団についての検討
t = 3.213, df = 52, p-value = 0.002257
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.1562533 0.6084419
sample estimates:
cor
0.4069862#下位集団についての検討
t = -3.6086, df = 54, p-value = 0.0006737
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.6306117 -0.2012045
sample estimates:
cor
-0.4407887#二集団の相関は異なるのか
Correlation tests
Call:r.test(n = 54, r12 = -0.4407887, r34 = 0.4069862, n2 = 54)
Test of difference between two independent correlations
z value 4.57 with probability 0
⇒ 下位5%の集団については、序盤を飛ばせば飛ばすほど、最後のセクションでは遅くなることがわかりました。
統計学的には渋滞はタイムに影響したとはいえない
5時間以内に仁科峠のエイドに辿り着くことができなければ、AA28のスタートと被ってしまうため、AA28の選手による渋滞の餌食となる、と感覚的には理解していました。しかし、それが本当に正しいことか、検証しました。
やったこと: 仁科峠を235分~295分で通過した集団と320分~380分で通過した集団について比較した。
70Kのスタートが6:00、AA28のスタートが11:00なので仁科峠に5時間 (=300分) 以内につくことができなければ渋滞に巻き込まれます。よって、上記のように時間を設定し、渋滞に巻き込まれた組と巻き込まれていない組について比較することとしました。
ここでひとつの仮説:
これは直観的に正しいと納得できますが、仁科峠までのタイムと仁科峠以降のタイムは比例関係にあるはずです。完走者全集団を対象とした解析では、無相関検定の結果はt = 59.639, df = 1066, p-value < 2.2e-16となり、有意な相関が認められます。
もし、渋滞が存在し、タイムが遅くなるのだとすれば、AA28スタート前後で仁科峠に到達した二集団の相関係数は異なってくると考えられます。
まず、二集団の散布図、それに伴う回帰直線を壁画しました。
直観的には2つの集団は同一の回帰直線上周囲にあるように見えます。
しかし、2集団の相関係数は以下のようになります。
> r_A (AA28スタート以降仁科峠到着組)
[1] 0.4988133
> r_B (AA28スタート以前仁科峠到着組)
[1] 0.364655
こうしてみてみると、2集団の相関係数には違いがあるように見えます。
本当でしょうか?相関係数の差の検定を行うと以下のようになります。
Call:r.test(n = r_A_num, r12 = r_A, r34 = r_B, n2 = r_B_num)
Test of difference between two independent correlations
z value 1.52 with probability 0.13
棄却されてしまいました。ということで、統計学的には、相関係数の違いを認められないので、渋滞はタイムに影響したとは言えなさそうです。また、上記集団のタイム設定が影響しているのかと考え、あれこれと弄ってみましたが、有意であるとの結論は得られませんでした。
思いついたら他の分析もやってみようかと。