Математическа статистика

Математическа статистика
(от математика и лат. statistica
от status – състояние).

Математическата статистика е дял от математиката, тясно свързан с теорията на вероятностите и посветен на математическите методи за систематизиране, обработване и използване на статистически данни за научни и практически изводи. Статистическите данни са сведения за броя на обектите в някаква съвкупност, за стойностите на някакви параметри и т. н. Обикновено в теорията на вероятностите се предполага, че са известни вероятностите на едни събития, след което по определени правила се изчисляват вероятностите на други, по-сложни събития; или пък са дадени разпределенията на някакви променливи величини и трябва да се пресметнат техни числови характеристики.

При хвърляне на монета напр. се предполага, че тя е правилна (симетрична), т. е. с вероятност 0,5 се пада „тора“ и с вероятност 0,5 — „ези“. Това предположение може да се провери и експериментално: ако при голям брой опити се окаже, че около половината от изходите са „тора“, то вече може да се смята, че монетата е симетрична. Въпросът е: колко да бъдат тези опити? На този и на редица други въпроси отговор може да даде именно математическата статистика.

хистограма
Хистограма

Основна задача на математическата статистика е въз основа на резултати от експеримент да се направят статистически изводи: да се намерят напр. вероятностите на интересуващи ни събития или разпределението на разглеждана случайна величина, или числови характеристики на тази величина. Методите на математическата статистика дават възможност да се взимат решения, за които вероятността да са правилни е произволно близка до 1. При това съществено се използват резултати от теорията на вероятностите, най-често законът за големите числа и цетралната гранична теорема.

Ако представлява интерес вероятностното разпределение на определен признак, тогава по направени измервания (наблюдения) се построява т. нар. хистограма. От вида на хистограмата може да се добие представа за вида на търсеното разпределение. След това се прилагат строго обосновани методи, за да се провери достоверността на направеното предположение. Степента на достоверност е по-голяма, ако се използват повече данни, т. е. ако са проведени по-голям брой измервания.

Най-често използваните числови характеристики на случайна величина са средна стойност и дисперсия. Ако се предположи, че те са неизвестни, но се разполага n независими измервания x1, …, xn, то целта е по тези данни да се намерят приблизително стойностите на двата неизвестни параметъра. Числата x=(x1+…+xn)/n и формула се наричат емпирично средно и емпирична дисперсия и в определен смисъл са най-добрите търсени оценки. Това са примери на т. нар. точкови оценки. Някои от свойствата им са следствие на закона за големите числа. Ако се приложат други гранични теореми, може да се построят и т. нар. доверителни интервали, т. е. интервали, които съдържат неизвестните параметри с предварително зададена вероятност. Математическата статистика може да даде отговор за достоверността на статистическите хипотези. Това са хипотези, които се отнасят до параметрите на някакво разпределение, до вида на разпределението на някаква величина или до някаква специална характеристика на разглеждана съвкупност от обекти. Типична ситуация е следната. В завод се приема голяма партида изделия, но не се знае какъв е процентът на брака. Предварително обаче е определен максималният процент на брака, примерно 3%. Ясно е, че има две хипотези: едната, че партидата е редовна (бракът не надминава 3%) и другата, че партидата е нередовна — така всичко се свежда до въпроса за относителния дял на бракуваните изделия. Той е или по-голям, или по-малък от 3%. В първия случай партидата не може да се приеме, докато във втория се приема. Да се провери обаче цялата партида е много скъпо, а често и невъзможно. Оказва се, че задоволителни резултати може да се получат и като се изследва са част от партидата, като се предполага, че тази част представлява случайно избрана извадка. Това е същността на широко използвания извадъчен метод. Възможно е при прилагане на методите на математическата статистика да се стигне до резултат, който не се съгласува с действителността. Във всички случаи това се дължи на недостатъчен брой измервания или на неправилни априорни (направени преди опита) предположения за вида и параметрите на изучавано разпределение.

Използването на съвременни компютри за обработване на големи масиви от данни се оказва необходимо и изключително полезно както за решаването на чисто научни проблеми, така и в практическата дейност на хората. Едни от най-важните области на приложение на математическата статистика са статистическият контрол на качеството на масова промишлена продукция и оптималното планиране на експерименти.

Вж. Теория на вероятностите.

Няма коментари - Остави коментар

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

Можете да използвате тези HTML тагове и атрибути: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>