Téma t5: Přeplněná tramvaj

Zadáno v čísle 25.2.

Zadání

Určitě jste už někdy jeli vlakem nebo MHD. Možná dokonce obojím. Pravděpodobně jste si pak také všimli, že po výjezdu z výchozí stanice bývá takový vůz téměř prázdný a stejně tak bývá téměř prázdný při příjezdu do cílové stanice. Každý si asi domyslí proč. Mezi těmito dvěma body se však nachází $n-2$ dalších stanic, ve kterých se počet lidí uvnitř vozu jistým způsobem vyvíjí, pravděpodobně někde nabývá svého maxima, a tak může i vlak, který se na začátku i na konci své cesty zdá být poloprázdný, někde v polovině zcela selhat z kapacitních důvodů. Cílem každé dopravní společnosti je samozřejmě se takové věci vyvarovat a optimalizovat dopravní síť, což ovšem není možné bez předchozí analýzy vytíženosti vlaku v jednotlivých fázích cesty. Naším cílem v tomto témátku tudíž bude studium křivky popisující vývoj počtu lidí uvnitř dopravního prostředku v průběhu jeho cesty stanicemi. Budeme tedy hledat křivku, která bude mít na ose $x$ číslování\footnote{Pozor, číslování se ve skutečnosti nevztahuje k samotným stanicím, nýbrž k úsekům mezi nimi (podrobnosti v příloze). } stanic na lince (pro sjednocení značení nechť je to $N$) a na ose $y$ okamžitý počet lidí sedících v dopravním prostředku (nechť je to $S$).

Tuto úlohu budeme řešit dvěma hlavními metodami. První, jednodušší metoda, je vcelku předvídatelná: jde o experimentální stanovení naší křivky $S(N)$. V zájmu maximalizace přesnosti výsledku experimentu je pochopitelně nezbytné provést co nejvíce měření. Mnou doporučovaný postup provedení uznatelného měření spočívá v absolvování jízdy po dané lince z výchozí stanice do konečné a zaznamenávání okamžitého počtu přítomných spolucestujících mezi každými dvěma stanicemi. Kreativitě při vymýšlení jiných postupů se meze nekladou, ovšem uznány budou pochopitelně pouze ty funkční a dobře popsané.

Úloha zkoumání experimentální metodou zůstává otevřená až do odvolání nebo do uzavření témátka. Hodnocena bude podle počtu a přínosnosti provedených měření (např. z měření na lince s padesáti stanicemi lze získat o křivce $S(N)$ lepší představu než na lince s pěti stanicemi.).

Druhá metoda řešení bude metodou analytickou. Dostanete za úkol čistě matematickými metodami odvodit analytický předpis pro funkci $S(N)$. To je samozřejmě samo o sobě velmi náročným cílem, nebudeme o to tedy usilovat hned. Běžně se ve vědě totiž při hledání matematického popisu čehokoli vychází z předem známých rovnic ověřených v obecnějších případech a odvozených z nějaké prvotní úvahy. Pro situaci proměnného počtu lidí v dopravním prostředku nám žádné rovnice známy nejsou. To znamená pro vás, řešitele, příležitost si vyzkoušet pozici vědce stojícího ještě před objevením dnešních vědeckých metod a odkázaného pouze na své úvahy a svou nepodloženou představu o fungování světa. Bude zapotřebí, abyste na základě toho, jak víte, že vlaky, autobusy, tramvaje apod. fungují, vymysleli jistý zjednodušující model toho, jak se cestující dopravních prostředků chovají, aby tento model nám, teoretikům, umožňoval popsat, jakým způsobem se ve které stanici bude měnit počet lidí uvnitř prostředku. Vyvození tvaru $S(N)$ z vašeho modelu ponechávám na vás zatím čistě jako dobrovolné, samozřejmě za bonusové bodové ohodnocení.

Pozor, u hledání vhodného zjednodušujícího modelu se neočekává jednoznačné řešení! Nežádám, abyste nalezli stejný model jako já! Pokud váš model není špatný na první pohled, klidně může i on být tím správným, alespoň v jisté aproximaci. Pro rozeznání správného modelu k popisu $S(N)$ nám úvahy stačit nebudou, pro ně budeme muset využít srovnání s experimentem. Proto jestli máte nápad, nebojte se o něj podělit, třeba se právě on v některé z posledních sérií ukáže být tím pro popis nejvhodnějším. Všichni autoři nejvhodnějšího popisu pak budou odměněni body navíc.

Toto jsou vaše první úkoly k tomuto témátku:


Problém 1:

Proveďte co nejvíce měření křivky $S(N)$ dle výše uvedeného návodu na jakékoli dopravní lince autobusu, tramvaje, nebo podobného dopravního prostředku. Nezapomeňte u provedených měření zhodnotit jejich věrohodnost a diskutovat, kde mohla případná nepřesnost vzniknout. Pro přehlednost také uveďte, které linky a kdy jste zkoumali. Tento problém není časově omezený.


Problém 2:

Vymyslete jeden nebo více zjednodušujících modelů, z nichž každý nějakým způsobem popíše, dle jakých pravidel reální lidé v dopravním prostředku nastupují a vystupují, aby se na tato pravidla dalo dále navázat.


Příloha

Teorie pravděpodobnosti

Pro snazší porozumění výše uvedené úloze je dobré zmínit zde ve stručnosti úplné základy teorie pravděpodobnosti a fyzikální statistiky.

Teorie pravděpodobnosti je odvětví matematiky založené v 17. století Blaisem Pascalem a Pierrem Fermatem za účelem popisu nedeterministických jevů, to jest takových, které při námi nerozlišitelných vstupních parametrech dávají různé výsledky. Jakým způsobem tento popis funguje, budu prezentovat na příkladu klasické šestistěnné kostky.

Příklad: Při házení férovou kostkou obyčejně výsledek hodu neumíme předem nijak odhadnout. Kostka tedy představuje \textit{náhodný generátor} a každý hod kostkou nazýváme \textit{pokusem}, jehož výsledkem je pak \textit{náhodná veličina} $X$, což zde bude jednoduše číslo, které padne. Z formálního hlediska je to funkce $X{:}\, M\to\Omega$ zobrazující z nějaké množiny vstupních parametrů $M$ (u kostky to může být například číslo, které bylo na horní stěně, když jsme kostku brali do ruky) do \textit{prostoru možných výstupů} $\Omega$. \textit{Výstupem} kostky může být kterýkoli prvek $x_i\in\Omega$, zde tedy kterékoli číslo z množiny\footnote{matematický zápis množiny, viz \url{https://matematika.cz/mnozinove-operace}} $\Omega=\{1, 2, 3, 4, 5, 6\}$. Množinu $A\subseteq\Omega$ takových možných výstupů označujeme jako \textit{jev}, který mohl nebo nemusel nastat. U kostky můžeme zadefinovat jako jevy například $A=\{ x_i;x_i$ je liché$\}=\{1, 3, 5\}$ nebo $B=\{ x_i; x_i>3\}=\{ 4, 5, 6\}$.

Náhodnou veličinu charakterizuje její tzv. \textit{pravděpodobnostní rozdělení} -- funkce\footnote{Zápis $2^\Omega$ se používá k označení tzv.~potenční množiny, což je množina všech podmnožin $\Omega$, viz \url{https://matematika.cz/mnoziny\#potencni-mnozina}.} $P{:}\, 2^{\Omega}\to[0, 1]$, která každému jevu $A\subseteq\Omega$ přiřadí číslo $P\in[0, 1]$ tak, aby: % Zas tak sofistikované to nakonec není... \begin{itemize} \item[(i)] $P(\Omega)=1$ \item[(ii)] $P(A\cup B)=P(A)+P(B)-P(A\cap B)$ \end{itemize}

Přiřazené číslo nazýváme \textit{pravděpodobností} daného jevu.

Můžeme si to znovu představit na příkladu kostky: Pravděpodobnostní rozdělení je zde definováno jako $P({x_i})=1/6$ pro $i=1\ldots6$ (obecně je-li funkce $P({x_i})$ konstantní jako zde, příslušné rozdělení se nazývá \textit{uniformní}).

Axiom (i) pravděpodobnostního rozdělení říká, že zcela jistě padne některý výsledek z $\Omega$, což u kostky očividně platí, neboť $P\left(\{1, 2, 3, 4, 5, 6\}\right) =P(\{1\})+\cdots+P(\{6\})=1$. Axiom (ii) pak udává vztahy mezi pravděpodobnostmi jednotlivých jevů. U dvou nezávislých jevů poslední člen vypadne, pravděpodobnosti nezávislých jevů se tedy jednoduše sčítají. Platnost tohoto axiomu si můžeme znovu ověřit u kostky na dvou výše definovaných jevech $A$ a $B$. Do levé strany dosadíme $P(A\cup B)=P(\{1, 3, 4, 5, 6\}) = 5/6$ a stejně tak do pravé $P(A)+P(B)-P(A\cap B)=P(\{1, 3, 5\})+P(\{4, 5, 6\})-P(\{5\})=1/2+1/2-1/6=5/6$. \medskip

Náhodným veličinám s číselnými výstupy bývají přiřazovány další vlastnosti, z nichž nejvýznamnější pro nás představují \textit{střední hodnota} a \textit{variance}. Střední hodnota $\mu(X)$ je definována jako suma součinů: $\mu(X)=\sum_{x_i\in\Omega} x_iP(x_i)$ (v případě uniformního rozdělení se tento vztah redukuje na aritmetický průměr) a má význam očekávaného\footnote{Pozor, očekávaný výsledek nemusí být vždy ten nejpravděpodobnější. Je to výsledek, kterému se při delším opakování bude blížit průměr z jednotlivých dílčích výsledků. Například když si na strany férové mince napíšeme číslice 0 a 1, po chvíli házení se bude průměr našich výsledků blížit číslu 1/2, ačkoli pravděpodobnost, že by nám v kterémkoli hodu padla strana s takovou číslicí, je nulová.} výsledku každého pokusu. Variance (rovněž \textit{rozptyl}) $\sigma^2$ je potom definována velmi podobně jako $\sigma^2(X)=\sum_{x_i\in\Omega} {(\mu(X)-x_i)}^2P(x_i)$. Odmocnina z variance se nazývá \textit{směrodatná odchylka} $\sigma$ a zjednodušeně řečeno má význam vzdálenosti od střední hodnoty, v níž se výsledky pokusů převážně drží.

Skutečný význam pravděpodobnosti objasňuje teprve \textit{zákon velkých čísel}, což je teorém, dle kterého se při mnohonásobném opakování pokusu relativní četnosti jednotlivých výsledků rozdělují v poměru daném pravděpodobnostmi těchto výsledků. Označíme-li tedy $N$ počet provedených pokusů a $N_i$ počet pokusů, které skončily výsledkem $x_i$, tento zákon říká, že $P(x_i)=\lim_{N \to \infty}\frac{N_i}{N}$. To jest, že i systém v principu chaotický se z dlouhodobého hlediska chová deterministicky.

Poslední zajímavou odbočku k teorii pravděpodobnosti bude v tomto stručném shrnutí představovat \textit{Centrální limitní teorém}. Mějme náhodnou proměnnou $X$ s libovolným pravděpodobnostním rozdělením. Nechť tato veličina vygeneruje $n$ náhodných výsledků. Jejich součet je pak rovněž náhodnou veličinou. Označme ho $S_n(X)$. Centrální limitní teorém potom říká, že čím vyšší $n$ zvolíme, tím více se pravděpodobnostní rozdělení $S_n$ blíží tzv. \textit{Gaussovu rozdělení}.

Gaussovo (tzv. normální) rozdělení je známé rozdělení zvonovitého tvaru. Právě díky Centrálnímu limitnímu teorému a jeho nezávislosti na původním rozdělení se Gaussovo rozdělení vyskytuje na mnoha místech v přírodě, a je proto dobré ho znát. Ve své nejjednodušší podobě je popsané vztahem $P(x)=\frac{1}{\sqrt{\pi}}e^{-x^2}$. Vhodně doplněnými konstantami se dá modifikovat jeho střední hodnota a variance, podoba zde uvedená se nazývá \textit{standardní normální rozdělení}.


Problém 3 (bonusový) [3b]:

Abyste si sami prověřili, že jste tomuto článku dobře porozuměli, podívejme se nyní na případ, kdy náhodná veličina $X$ odpovídá součtu tří nezávislých hodů šestistěnnou kostkou. Zamyslete se, co zde představuje množinu $\Omega$, zakreslete do grafu pravděpodobnostní rozdělení a spočítejte jeho střední hodnotu a varianci.


Fyzikální statistika 

Teorie pravděpodobnosti nachází dobré uplatnění mimo jiné ve fyzikální statistice, ve které samotné veličiny zkoumané sebepřesnějším experimentem představují náhodné proměnné a jejich výsledky slouží k tomu, aby za jejich pomoci byla odhadnuta střední hodnota měřené veličiny, která je teprve prohlášena za hodnotu skutečnou. Jednotlivá fyzikální měření pak z různých důvodů nevycházejí přesně a jsou od této \uv{skutečné} hodnoty více nebo méně odchýlena. Jejich předpokládané odchýlení je nezbytné uvést ve výsledku jako tzv. \textit{odchylku} nebo \textit{chybu}.

Tyto chyby se dělí na několik nejčastějších typů. Prvním druhem jsou \textit{chyby hrubé}, které vznikají nesprávným provedením experimentu, popř. hrubým zásahem do něho. Ty je potřeba mezi výsledky rozpoznat a odstranit.

Druhou skupinu představují \textit{chyby systematické}, vzniklé špatnou kalibrací nebo interpretací. Jejich vliv zatíží všechny výsledky stejným způsobem, je možno měření tedy dále využít, přijde-li se na to, kde a jaká chyba vznikla, a podaří-li se ji opravit.

Poslední, pro nás nejzajímavější, druh odchylek představují \textit{odchylky statistické}, vzniklé čistě vlivy náhodnými. Statistická odchylka se po opakovaném měření projeví rozptylem hodnot, neovlivní však nijak střední hodnotu. Tyto odchylky uvádíme ve výsledku ve tvaru $x\pm\sigma_x$, kde $x$ představuje námi odhadnutou střední hodnotu a $\sigma_x$ \textit{absolutní odchylku}, tedy informaci, o kolik se může naše hodnota lišit od hodnoty skutečné. Jak ze značení, tak z významu je zjevná její souvislost se střední kvadratickou odchylkou. Konkrétně v situaci vcelku častého standardního normálního rozdělení platí, že ve vzdálenosti nejvýš $\sigma$ od střední hodnoty leží výsledek s pravděpodobností 68 \%, ve vzdálenosti $2\sigma$ s pravděpodobností 95 \% a ve vzdálenosti $3\sigma$ s pravděpodobností 99,7 \%.

Alternativně k absolutní odchylce se využívá \textit{odchylka relativní}, definovaná jako $\eta_x=\frac{\sigma_x}{x}$. Z ní se dá vyčíst, jak velkou nepřesnost pro nás ve skutečnosti absolutní odchylka znamená.

Ze zákona velkých čísel vyplývá, že čím více měření bude provedeno, tím blíže by střední hodnota našich výsledků měla být střední hodnotě skutečného rozdělení pravděpodobnosti. Z toho vyplývá jednak, že ve skutečně věrohodných fyzikálních experimentech je potřeba provést měření velice mnoho, a jednak, že při rostoucím počtu provedených měření by měla odchylka našeho odhadu střední hodnoty klesat. Pro naše účely stačí vědět, že tento pokles se dá odhadnout jako $\sigma_{\tilde{x}}=\frac{\sigma_x}{\sqrt{n}}$, kde $n$ je počet měření a $\tilde{x}$ střední hodnota veličiny $x$ (podrobnosti a odvození možno dohledat v~\cite{prakt}).

Stává se rovněž běžně, že se u výsledné hodnoty nastřádá statistických odchylek víc, buďto z nepřímého měření, nebo odlišných původů. Jedná-li se o \textit{měření nepřímé}, tedy že hodnota vznikla matematickými operacemi s přímo naměřenými hodnotami, uplatníme \textit{metodu přenosu chyb}, tedy vztah: $$ \sigma_{f(x_1, \ldots, x_n)^2}=\sum_{k=1}^n \left(\frac{df}{dx_k}\sigma_{x_k}\right)^2 $$ tedy např.: $$ {\sigma_{xy}}^2=x^2{\sigma_y}^2+y^2{\sigma_x}^2 $$

Dvě odchylky nezávislých původů se pak skládají na kombinovanou standardní nejistotu: $\sigma^2=\sigma_x^2+\sigma_y^2$.

Odvození všech těchto vztahů lze znovu dohledat v~\cite{prakt}. \begin{center}\includegraphics[height=5cm]{obrazky/skladani-sil.eps}\end{center}

Nápověda k řešení

Zde si na závěr dovolím několik poznámek k úloze, které nepatří do zadání, přesto je však dobré si je před zahájením řešení přečíst.

Především bychom si měli sjednotit číslování stanic, které není zcela přímočaré. Už bylo ostatně nastíněno v poznámce k zadání, že se $N$ vztahuje nikoli ke stanicím, nýbrž k úsekům mezi nimi (hodnoty však budeme stále vynášet na celých číslech). Doporučuji úseky číslovat vždy podle stanice, z níž vůz právě vyjíždí. Dále doporučuji výchozí depo, resp. konečné depo považovat za nultou, resp. $(n+1)$-ní stanici ($n$ nechť značí celkový počet stanic na lince). S tímto číslováním je jisté, že v $N=0$ bude vynesena hodnota $S$ příslušející úseku mezi depem a první stanicí, kde je samozřejmě $S=0$, stejně tak jako v $N=n$. Křivka $S(N)$ pak bude vycházet z bodu $[0, 0]$ a časem se do nuly zase vrátí, což bude jednak estetičtější, jednak přehlednější.

Tato úloha sice není fyzikální, některé rysy fyziky však přesto vykazuje. Okamžitý počet lidí v dopravním prostředku je jistá náhodná veličina, jejíž množinou možných výsledků je $\Omega=\mathbb{N}_0$ a jejíž rozdělení pravděpodobnosti stejně jako námi hledaná střední hodnota závisí jednak na fázi trasy, v níž se prostředek právě nachází (což je jediná závislost, kterou my chceme zkoumat), mimoto ale také na denní době, vytíženosti linky, typu prostředku apod. Abychom všechny tyto vedlejší závislosti z našeho měření odfiltrovali, musíme se nad úlohou nejdřív trochu zamyslet.

Na začátku úlohy, když bylo zadáno hledání obecného tvaru křivky $S(N)$, byl tímto zadáním zároveň vysloven předpoklad, že takový obecný tvar existuje, tj. že křivka $S(N)$ si ponechává ve všech situacích tvar stejný, který se pouze jistým způsobem roztahuje a smršťuje právě v souvislosti s vytížeností linky a s počtem stanic na lince (v prvním případě se to projeví modifikací ve svislém směru, ve druhém případě ve vodorovném). Tento předpoklad není podložen ničím kromě intuice a pravděpodobně se dokonce časem ukáže, že v jistých speciálních případech neplatí.

Přesto můžeme zatím předpokládat jeho platnost alespoň v situacích vzájemně si podobných. Není tedy například nesmyslné srovnávat tvar $S(N)$ u linky s deseti a u linky s jedenácti stanicemi. Srovnání takových linek ovšem nelze provést v grafu, jehož osa $x$ bude odpovídat přímému číslování stanic $N$ (přinejmenším proto, že jedna z křivek bude končit o stanici dál). Proto pro hledání obecného tvaru naší křivky doporučuji přejít k redukovanému číslování stanic $\tilde{N}=\frac{N}{n+1}$ ($n+1$ je skutečná délka trasy vynášené na grafu).

Sami si rozmyslete, jak podobným způsobem co nejlépe redukovat okamžitý počet cestujících $S$ na $\tilde{S}$.

Nyní jsme od křivky $S(N)$ přešli ke křivce $\tilde{S}(\tilde{N})$. Ta by dle našeho předpokladu měla mít stejný tvar jako $S(N)$ (šlo jen o přenásobení konstantami) pouze s rozdílem, že jejím definičním oborem i oborem hodnot bude interval $[0, 1]$. To je pro nás úžasný výsledek, protože nyní jsme upravili naši křivku do takové podoby, která zachovává její tvar a přitom není závislá ani na počtu stanic na lince, ani na tom, kolik lidí linkou právě jede (jde jen o to, jak se tento počet relativně mění).

Tím pádem jsme se zbavili závislosti zkoumané střední hodnoty na všech výše uvedených nepodstatných parametrech a zbyla nám pouze kýžená závislost na fázi cesty. Ani ta však není zcela nezávadná. Asi každý si dovede představit, že na pevně dané lince jsou některé stanice více frekventované než jiné. Proto kdybychom měření prováděli neustále na stejné lince, vyšla by nám i po redukci odlišná křivka, než kdybychom stejné měření prováděli na lince jiné. Proto vyjdeme-li z předpokladu, že rozložení frekventovaných stanic na Nespecifikované lince je náhodné, mé další doporučení ke hledání obecného tvaru bude nabádat ke zkoumání přednostně většího počtu linek jednou nežli jedné linky mnohokrát. Dodržování tohoto doporučení už bude hodnoceno skrze přínosnost provedeného měření (viz zadání).

Tímto doporučením dnešní odbočku k nápovědám k řešení zakončuji, přeji hodně štěstí při řešení jak experimentální části, tak i teoretické.

Reference

[1] Ch. M. Grinstead, J. L. Snell: Introduction to Probability, American Mathematical Society, Copyright (C) 2003

[2] J. Englich: Úvod do praktické fyziky I: Zpracování výsledků měření, MATFYZPRESS, Praha 2006

Evžen; JanSkvara@email.cz
e-mailová konference: tramvaj@mam.mff.cuni.cz