Изчислете средно аритметично онлайн. Как да изчислим правилно средната стойност? Как да намерите средноаритметичното на числата

Средна заплата… Средна продължителност на живота… Почти всеки ден чуваме тези фрази, използвани за описание на множество с едно число. Но колкото и да е странно, „средната стойност“ е доста коварна концепция, която често подвежда обикновен човек, който няма опит в математическата статистика.

Какъв е проблемът?

Под средна стойност най-често се разбира средноаритметичното, което силно варира под влияние на отделни факти или събития. И няма да получите реална представа как точно са разпределени ценностите, които учите.

Да вземем класически пример за средната заплата.

Една абстрактна компания има десет служители. Девет от тях получават заплата от около 50 000 рубли, а един - 1 500 000 рубли (по странно съвпадение той е и генерален директор на тази компания).

Средната стойност в този случай ще бъде 195 150 рубли, което, както виждате, е грешно.

Какви са начините за изчисляване на средната стойност?

Първият начин е да се изчисли вече споменатото средноаритметично, което е сумата от всички стойности, разделена на техния брой.

  • x – средно аритметично;
  • x n - специфична стойност;
  • n - брой стойности.
  • Работи добре с нормално разпределение на стойностите в извадката;
  • Лесен за изчисляване;
  • Интуитивен.
  • Не дава реална представа за разпределението на стойностите;
  • Нестабилно количество, което лесно се изхвърля (както в случая с главния изпълнителен директор).

Вторият начин е да се изчисли мода, което е най-често срещаната стойност.

  • M 0 - режим;
  • x0 е долната граница на интервала, който съдържа режима;
  • n е стойността на интервала;
  • f m - честота (колко пъти дадена стойност се среща в серия);
  • f m-1 - честотата на интервала, предхождащ модалния;
  • f m+1 е честотата на интервала, следващ модала.
  • Чудесно за получаване на усещане за общественото мнение;
  • Добър за нечислови данни (цветове на сезона, бестселъри, рейтинги);
  • Лесно за разбиране.
  • Модата може просто да не съществува (без повторения);
  • Може да има няколко режима (мултимодално разпространение).

Третият начин е да се изчисли медиани, тоест стойността, която разделя подредената проба на две половини и се намира между тях. И ако няма такава стойност, тогава средноаритметичната стойност между границите на половините на извадката се приема като медиана.

  • M e е медианата;
  • x0 е долната граница на интервала, който съдържа медианата;
  • h е стойността на интервала;
  • f i - честота (колко пъти дадена стойност се среща в серия);
  • S m-1 - сумата от честотите на интервалите, предхождащи медианата;
  • f m е броят на стойностите в средния интервал (неговата честота).
  • Предоставя най-реалистичната и представителна оценка;
  • Устойчив на емисии.
  • По-трудно е да се изчисли, тъй като пробата трябва да бъде поръчана преди изчислението.

Разгледахме основните методи за намиране на средната стойност, т.нар мерки на централната тенденция(всъщност има повече, но тези са най-популярните).

Сега нека се върнем към нашия пример и изчислим и трите варианта на средната стойност, като използваме специални функции на Excel:

  • AVERAGE(число1;[число2];…) — функция за определяне на средно аритметично;
  • FASHION.ONE(number1,[number2],...) - модна функция (по-старите версии на Excel използваха FASHION(number1,[number2],...));
  • MEDIAN(число1;[число2];...) е функция за намиране на медианата.

И ето стойностите, които получихме:

В този случай режимът и медианата характеризират много по-добре средната заплата в компанията.

Но какво да направите, когато в извадката няма 10 стойности, както в примера, а милиони? В Excel това не може да се изчисли, но в базата данни, където се съхраняват вашите данни, няма проблем.

Изчислете средноаритметичната стойност в SQL

Тук всичко е доста просто, тъй като SQL предоставя специална агрегатна функция AVG.

И за да го използвате, е достатъчно да напишете следната заявка:

Изчисляване на режима в SQL

SQL няма отделна функция за намиране на режима, но можете лесно и бързо да го напишете сами. За да направим това, трябва да разберем коя от заплатите се повтаря най-често и да изберем най-популярната.

Нека напишем запитване:

/* WITH TIES трябва да се добави към TOP(), ако наборът е мултимодален, което означава, че наборът има множество режими */ SELECT TOP(1) WITH TIES заплата КАТО „Режим на заплата“ ОТ служители ГРУПИРАНЕ ПО заплата ORDER BY COUNT(*) DESC

Изчислете медианата в SQL

Както при модата, SQL няма вградена функция за изчисляване на медианата, но има обща функция за изчисляване на процентили PERCENTILE_CONT.

Всичко изглежда така:

/* В този случай 0,5 процентилът ще бъде медианата */ ИЗБЕРЕТЕ TOP(1) PERCENTILE_CONT(0,5) В ГРУПАТА (ПОРЪД ПО заплата) OVER() КАТО "средна заплата" ОТ служители

По-добре е да прочетете повече за работата на функцията PERCENTILE_CONT в помощта на Microsoft и Google BigQuery.

Какъв начин да използвам все пак?

От горното следва, че медианата По най-добрия начинза изчисляване на средната стойност.

Но не винаги е така. Ако работите със средната стойност, пазете се от мултимодална дистрибуция:

Графиката показва бимодално разпределение с два пика. Такава ситуация може да възникне например при гласуване на избори.

В този случай средната аритметична стойност и медианата са стойности някъде по средата и те няма да кажат нищо за това, което наистина се случва и е по-добре веднага да разпознаете, че имате работа с бимодално разпределение, като докладвате два режима.

Още по-добре, разделете извадката на две групи и съберете статистически данни за всяка.

Изход:

При избора на метод за намиране на средната стойност е необходимо да се вземе предвид наличието на извънредни стойности, както и нормалното разпределение на стойностите в извадката.

Окончателният избор на мярката на централната тенденция винаги е на анализатора.

В математиката средноаритметичната стойност на числата (или просто средната стойност) е сумата от всички числа в даден набор, разделена на техния брой. Това е най-обобщеното и разпространено понятие за средна стойност. Както вече разбрахте, за да намерите средната стойност, трябва да сумирате всички дадени числа и да разделите резултата на броя термини.

Какво е средно аритметично?

Нека разгледаме един пример.

Пример 1. Дадени са числа: 6, 7, 11. Трябва да намерите средната им стойност.

Решение.

Първо, нека намерим сбора на всички дадени числа.

Сега разделяме получената сума на броя на членовете. Тъй като имаме съответно три члена, ще разделим на три.

Следователно средната стойност на числата 6, 7 и 11 е 8. Защо 8? Да, защото сборът от 6, 7 и 11 ще бъде същият като три осмици. Това ясно се вижда на илюстрацията.

Средната стойност донякъде напомня на "подравняването" на поредица от числа. Както можете да видите, купчините моливи са станали на едно ниво.

Помислете за друг пример, за да консолидирате получените знания.

Пример 2Дадени са числата: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Трябва да намерите средното им аритметично.

Решение.

Намираме сумата.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Разделете на броя термини (в този случай 15).

Следователно средната стойност на тази поредица от числа е 22.

Сега разгледайте отрицателните числа. Нека си припомним как да ги обобщим. Например, имате две числа 1 и -4. Нека намерим тяхната сума.

1 + (-4) = 1 – 4 = -3

Като знаете това, разгледайте друг пример.

Пример 3Намерете средната стойност на поредица от числа: 3, -7, 5, 13, -2.

Решение.

Намиране на сбора на числата.

3 + (-7) + 5 + 13 + (-2) = 12

Тъй като има 5 члена, разделяме получената сума на 5.

Следователно средноаритметичното на числата 3, -7, 5, 13, -2 е 2,4.

В нашето време на технологичен прогрес е много по-удобно да се използват компютърни програми, за да се намери средната стойност. Microsoft Office Excel е един от тях. Намирането на средната стойност в Excel е бързо и лесно. Освен това тази програма е включена в софтуерния пакет от Microsoft Office. Обмисли кратки инструкциикак да намерите средното аритметично с тази програма.

За да изчислите средната стойност на поредица от числа, трябва да използвате функцията AVERAGE. Синтаксисът за тази функция е:
=Средно(аргумент1, аргумент2, ... аргумент255)
където аргумент1, аргумент2, ... аргумент255 са или числа, или препратки към клетки (клетките означават диапазони и масиви).

За да стане по-ясно, нека проверим получените знания.

  1. Въведете числата 11, 12, 13, 14, 15, 16 в клетки C1 - C6.
  2. Изберете клетка C7, като щракнете върху нея. В тази клетка ще покажем средната стойност.
  3. Кликнете върху раздела "Формули".
  4. Изберете Още функции > Статистически, за да отворите падащия списък.
  5. Изберете СРЕДНО. След това трябва да се отвори диалогов прозорец.
  6. Изберете и плъзнете клетки C1-C6 там, за да зададете диапазона в диалоговия прозорец.
  7. Потвърдете действията си с бутона "OK".
  8. Ако сте направили всичко правилно, в клетка C7 трябва да имате отговора - 13.7. Когато щракнете върху клетка C7, функцията (=Средно(C1:C6)) ще се покаже в лентата за формули.

Много е полезно да използвате тази функция за счетоводство, фактури или когато просто трябва да намерите средната стойност на много дълъг диапазон от числа. Поради това често се използва в офиси и големи компании. Това ви позволява да поддържате записите в ред и дава възможност бързо да изчислите нещо (например средния доход на месец). Можете също да използвате Excel, за да намерите средната стойност на функция.

Средно аритметично

Този термин има и други значения, вижте средното значение.

Средно аритметично(в математиката и статистиката) набори от числа - сборът от всички числа, разделен на техния брой. Това е една от най-често срещаните мерки за централна тенденция.

Той е предложен (заедно със средното геометрично и средното хармонично) от питагорейците.

Специални случаи на средноаритметичната стойност са средната стойност (на генералната съвкупност) и средната стойност на извадката (на извадките).

Въведение

Обозначете набора от данни х = (х 1 , х 2 , …, х н), тогава средната стойност на извадката обикновено се обозначава с хоризонтална лента над променливата (x ¯ (\displaystyle (\bar (x))) , произнася се " хс тире“).

Гръцката буква μ се използва за означаване на средноаритметичното на цялата съвкупност. За случайна величина, за която е определена средната стойност, μ е средна вероятностили математическото очакване на случайна променлива. Ако наборът хе колекция от произволни числа със средна вероятност μ, тогава за всяка извадка х азот тази колекция μ = E( х аз) е очакването на тази проба.

На практика разликата между μ и x ¯ (\displaystyle (\bar (x))) е, че μ е типична променлива, защото можете да видите извадката, а не цялата популация. Следователно, ако извадката е представена произволно (от гледна точка на теорията на вероятностите), тогава x ¯ (\displaystyle (\bar (x))) (но не μ) може да се третира като случайна променлива, имаща вероятностно разпределение в извадката ( вероятностно разпределение на средната стойност).

И двете количества се изчисляват по същия начин:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Ако хе случайна променлива, тогава математическото очакване хможе да се разглежда като средноаритметично на стойностите при многократни измервания на количеството х. Това е проявление на закона големи числа. Следователно средната стойност на извадката се използва за оценка на неизвестното математическо очакване.

В елементарната алгебра се доказва, че средната н+ 1 число над средното нчисла, ако и само ако новото число е по-голямо от старото средно, по-малко, ако и само ако новото число е по-малко от средното, и не се променя, ако и само ако новото число е равно на средното. Колкото повече н, толкова по-малка е разликата между новата и старата средна стойност.

Обърнете внимание, че има няколко други налични „средни“, включително средно по степенен закон, средно по Колмогоров, средно хармонично, средно аритметично-геометрично и различни претеглени средни (напр. средно аритметично претеглено, средно геометрично претеглено, средно претеглено хармонично) .

Примери

  • За три числа трябва да ги съберете и разделите на 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).) x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Или по-лесно 5+5=10, 10:2. Тъй като добавихме 2 числа, което означава, че колкото числа добавим, на толкова разделяме.

Непрекъсната случайна променлива

За непрекъснато разпределена стойност f (x) (\displaystyle f(x)) средното аритметично в интервала [ a ; b ] (\displaystyle ) се дефинира чрез определен интеграл:

F (x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Някои проблеми при използването на средната стойност

Липса на здравина

Основна статия: Устойчивост в статистиката

Въпреки че средната аритметична стойност често се използва като средна стойност или централни тенденции, тази концепция не се прилага за стабилна статистика, което означава, че средната аритметична стойност е силно повлияна от „големи отклонения“. Трябва да се отбележи, че за разпределения с голяма асиметрия средноаритметичната стойност може да не съответства на концепцията за „средно“, а стойностите на средната стойност от стабилна статистика (например медианата) могат по-добре да опишат централната тенденция.

Класическият пример е изчисляването на средния доход. Средната аритметична стойност може да бъде погрешно изтълкувана като медиана, което може да доведе до извода, че има повече хора с повече доходи, отколкото има в действителност. „Средният“ доход се тълкува по такъв начин, че доходите на повечето хора са близки до това число. Този "среден" (в смисъла на средноаритметичния) доход е по-висок от дохода на повечето хора, тъй като високият доход с голямо отклонение от средния прави средноаритметичното силно изкривено (за разлика от това, средният доход "се съпротивлява" такова изкривяване). Въпреки това, този „среден“ доход не казва нищо за броя на хората близо до средния доход (и не казва нищо за броя на хората близо до модалния доход). Ако обаче понятията „среден“ и „мнозинство“ се приемат несериозно, тогава може да се заключи неправилно, че повечето хора имат доходи, по-високи от реалните. Например, доклад за "средния" нетен доход в Медина, Вашингтон, изчислен като средната аритметична стойност на всички годишни нетни доходи на жителите, ще даде изненадващо високо число, което се дължи на Бил Гейтс. Разгледайте извадката (1, 2, 2, 2, 3, 9). Средната аритметична стойност е 3,17, но пет от шестте стойности са под тази средна стойност.

Сложна лихва

Основна статия: ROI

Ако числата умножават се, но не гънка, трябва да използвате средното геометрично, а не средното аритметично. Най-често този инцидент се случва при изчисляване на възвръщаемостта на инвестициите във финансите.

Например, ако акциите паднаха с 10% през първата година и се повишиха с 30% през втората година, тогава е неправилно да се изчисли „средното“ увеличение през тези две години като средно аритметично (−10% + 30%) / 2 = 10%; правилната средна стойност в този случай се дава от комбинирания годишен темп на растеж, от който годишният растеж е само около 8,16653826392% ≈ 8,2%.

Причината за това е, че процентите имат нова начална точка всеки път: 30% са 30% от число, по-малко от цената в началото на първата година:ако акцията е започнала от $30 и е паднала с 10%, тя струва $27 в началото на втората година. Ако акциите се покачат с 30%, те струват $35,1 в края на втората година. Средната аритметична стойност на този растеж е 10%, но тъй като акциите са нараснали само с $5,1 за 2 години, средно увеличение от 8,2% дава краен резултат от $35,1:

[$30 (1 - 0,1) (1 + 0,3) = $30 (1 + 0,082) (1 + 0,082) = $35,1]. Ако използваме средноаритметичната стойност от 10% по същия начин, няма да получим действителната стойност: [$30 (1 + 0,1) (1 + 0,1) = $36,3].

Сложна лихва в края на година 2: 90% * 130% = 117%, т.е. общо увеличение от 17%, а средната годишна сложна лихва е 117% ≈ 108,2% (\displaystyle (\sqrt (117\%)) \приблизително 108,2\%) , тоест средногодишно увеличение от 8,2%.

Упътвания

Основна статия: Статистика на дестинацията

При изчисляване на средната аритметична стойност на някаква променлива, която се променя циклично (например фаза или ъгъл), трябва да се обърне специално внимание. Например средната стойност от 1° и 359° би била 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Този номер е неправилен по две причини.

  • Първо, ъгловите мерки са определени само за диапазона от 0° до 360° (или от 0 до 2π, когато се измерват в радиани). Така една и съща двойка числа може да бъде записана като (1° и −1°) или като (1° и 719°). Средните стойности на всяка двойка ще бъдат различни: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2))= 0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • Второ, в този случай стойност от 0° (еквивалентна на 360°) би била геометрично най-добрата средна стойност, тъй като числата се отклоняват по-малко от 0°, отколкото от всяка друга стойност (стойността 0° има най-малката дисперсия). Сравнете:
    • числото 1° се отклонява от 0° само с 1°;
    • числото 1° се отклонява от изчислената средна стойност от 180° със 179°.

Средната стойност за циклична променлива, изчислена съгласно горната формула, ще бъде изкуствено изместена спрямо реалната средна стойност към средата на числения диапазон. Поради това средната стойност се изчислява по различен начин, а именно числото с най-малка дисперсия (централна точка) се избира като средна стойност. Също така, вместо изваждане, се използва модулно разстояние (т.е. периферно разстояние). Например, модулното разстояние между 1° и 359° е 2°, а не 358° (върху окръжност между 359° и 360°==0° - един градус, между 0° и 1° - също 1°, общо - 2 °).

Среднопретеглена стойност - какво е това и как да го изчислим?

В процеса на изучаване на математиката учениците се запознават с понятието средно аритметично. В бъдеще в статистиката и някои други науки учениците ще се сблъскат и с изчисляването на други средни стойности. Какви могат да бъдат те и как се различават един от друг?

Средни стойности: значение и разлики

Не винаги точните показатели дават представа за ситуацията. За да се оцени тази или онази ситуация, понякога е необходимо да се анализират огромен брой цифри. И тогава на помощ идват средните стойности. Те ви позволяват да оцените ситуацията като цяло.


От училищните дни много възрастни помнят съществуването на средната аритметична стойност. Изчислява се много лесно - сумата от поредица от n члена се дели на n. Тоест, ако трябва да изчислите средната аритметична стойност в последователността от стойности 27, 22, 34 и 37, тогава трябва да решите израза (27 + 22 + 34 + 37) / 4, тъй като 4 стойности се използват в изчисленията. В този случай желаната стойност ще бъде равна на 30.

Често като част от училищния курс се изучава и средното геометрично. Изчисляването на тази стойност се основава на извличане на корен от n-та степен от произведението на n члена. Ако вземем едни и същи числа: 27, 22, 34 и 37, тогава резултатът от изчисленията ще бъде 29,4.

Хармоничната средна в общообразователното училище обикновено не е обект на изучаване. Въпреки това се използва доста често. Тази стойност е реципрочна на средната аритметична и се изчислява като частно от n - броя на стойностите и сумата 1/a 1 +1/a 2 +...+1/a n . Ако отново вземем същата серия от числа за изчисление, тогава хармоникът ще бъде 29,6.

Среднопретеглена стойност: характеристики

Въпреки това, всички горепосочени стойности може да не се използват навсякъде. Например в статистиката, когато се изчисляват някои средни стойности, важна роля играе "тежестта" на всяко число, използвано в изчислението. Резултатите са по-демонстративни и правилни, тъй като те вземат предвид повече информация. Тази група стойности се наричат ​​общо "среднопретеглена стойност". Те не се предават в училище, така че си струва да се спрем на тях по-подробно.

На първо място, струва си да се обясни какво се разбира под "тежестта" на определена стойност. Най-лесният начин да обясните това е да конкретен пример. Телесната температура на всеки пациент се измерва два пъти дневно в болницата. От 100 пациенти в различни отделения на болницата 44 ще бъдат с нормална температура - 36,6 градуса. Други 30 ще са с повишена стойност – 37,2, 14 – 38, 7 – 38,5, 3 – 39, а останалите две – 40. И ако вземем средно аритметично, то тази стойност общо за болницата ще е над 38 градуса ! Но почти половината от пациентите имат напълно нормална температура. И тук би било по-правилно да се използва среднопретеглената стойност, а "тежестта" на всяка стойност ще бъде броят на хората. В този случай резултатът от изчислението ще бъде 37,25 градуса. Разликата е очевидна.

В случай на среднопретеглени изчисления, „теглото“ може да се приеме като брой пратки, брой хора, работещи в даден ден, изобщо всичко, което може да бъде измерено и да повлияе на крайния резултат.

Разновидности

Среднопретеглената стойност съответства на средната аритметична стойност, разгледана в началото на статията. Въпреки това, първата стойност, както вече беше споменато, също взема предвид теглото на всяко число, използвано в изчисленията. Освен това има и претеглени геометрични и хармонични стойности.

Има още една интересна разновидност, използвана в серии от числа. Това е заотносно претеглената пълзяща средна. Именно на негова база се изчисляват тенденциите. В допълнение към самите стойности и тяхната тежест, там се използва и периодичност. И когато се изчислява средната стойност в даден момент от времето, се вземат предвид и стойностите за предишни периоди от време.

Изчисляването на всички тези стойности не е толкова трудно, но на практика обикновено се използва само обичайната среднопретеглена стойност.

Методи за изчисление

В ерата на компютъризацията не е необходимо ръчно да се изчислява среднопретеглената стойност. Въпреки това би било полезно да знаете формулата за изчисление, за да можете да проверите и, ако е необходимо, да коригирате получените резултати.

Най-лесно ще бъде да разгледаме изчислението на конкретен пример.

Необходимо е да се установи каква е средната работна заплата в това предприятие, като се вземе предвид броят на работниците, получаващи определена заплата.

И така, изчисляването на среднопретеглената стойност се извършва по следната формула:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Например изчислението би било:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Очевидно няма особена трудност при ръчното изчисляване на среднопретеглената стойност. Формулата за изчисляване на тази стойност в едно от най-популярните приложения с формули - Excel - изглежда като функцията SUMPRODUCT (серия от числа; серия от тегла) / SUM (серия от тегла).

Как да намеря средна стойност в Excel?

как да намеря средно аритметично в excel?

Владимир09854

Лесно като пай. За да намерите средната стойност в Excel, ви трябват само 3 клетки. В първия записваме едно число, във втория - друго. И в третата клетка ще отбележим формула, която ще ни даде средната стойност между тези две числа от първата и втората клетка. Ако клетка № 1 се нарича A1, клетка № 2 се нарича B1, тогава в клетката с формулата трябва да напишете така:

Тази формула изчислява средноаритметичната стойност на две числа.

За красотата на нашите изчисления можем да подчертаем клетките с линии, под формата на плоча.

В самия Excel също има функция за определяне на средната стойност, но аз използвам стария метод и въвеждам формулата, която ми трябва. Така съм сигурен, че Excel ще изчисли точно както ми трябва и няма да измисли някакво собствено закръгляване.

М3сергей

Това е много лесно, ако данните вече са въведени в клетките. Ако се интересувате само от число, просто изберете желания диапазон/диапазони и стойността на сумата от тези числа, тяхната средна аритметична стойност и техният брой ще се появят в лентата на състоянието долу вдясно.

Можете да изберете празна клетка, да кликнете върху триъгълника (падащ списък) "Автосума" и да изберете там "Средно", след което ще се съгласите с предложения диапазон за изчисление или изберете свой собствен.

И накрая, можете да използвате формулите директно - щракнете върху „Вмъкване на функция“ до лентата с формули и адреса на клетката. Функцията AVERAGE е в категорията "Статистически" и приема като аргументи както числа, така и препратки към клетки и т.н. Там можете също да изберете повече сложни опции, например AVERAGEIF - изчисляване на средната според условието.

Намерете средно в екселе доста проста задача. Тук трябва да разберете дали искате да използвате тази средна стойност в някои формули или не.

Ако трябва да получите само стойността, тогава е достатъчно да изберете необходимия диапазон от числа, след което excel автоматично ще изчисли средната стойност - тя ще се покаже в лентата на състоянието, заглавието "Средно".

В случай, че искате да използвате резултата във формули, можете да направите следното:

1) Сумирайте клетките с помощта на функцията SUM и ги разделете на броя на числата.

2) По-правилен вариант е да използвате специална функция, наречена AVERAGE. Аргументите на тази функция могат да бъдат числа, дадени последователно, или диапазон от числа.

Владимир Тихонов

оградете стойностите, които ще бъдат включени в изчислението, щракнете върху раздела „Формули“, там ще видите „Автосумиране“ вляво и до него триъгълник, сочещ надолу. кликнете върху този триъгълник и изберете "Средно". Voila, готово) в долната част на колоната ще видите средната стойност :)

Екатерина Муталапова

Да започнем отначало и по ред. Какво означава средно?

Средната стойност е стойността, която е средно аритметично, т.е. се изчислява чрез добавяне на набор от числа и след това разделяне на общата сума на числата на техния брой. Например за числата 2, 3, 6, 7, 2 ще бъде 4 (сумата от числата 20 се дели на техния номер 5)

В електронна таблица на Excel за мен лично най-лесният начин беше да използвам формулата =СРЕДНО. За да изчислите средната стойност, трябва да въведете данни в таблицата, да напишете функцията =AVERAGE() под колоната с данни и в скоби да посочите диапазона от числа в клетките, като маркирате колоната с данните. След това натиснете ENTER или просто щракнете с левия бутон върху произволна клетка. Резултатът ще се покаже в клетката под колоната. На пръв поглед описанието е неразбираемо, но всъщност става въпрос за минути.

Авантюрист 2000

Програмата Excel е многостранна, така че има няколко опции, които ще ви позволят да намерите средната стойност:

Първи вариант. Просто сумирате всички клетки и ги разделяте на техния брой;

Втори вариант. Използвайте специална команда, напишете в необходимата клетка формулата "= СРЕДНО (и тук посочете диапазона от клетки)";

Трети вариант. Ако изберете необходимия диапазон, обърнете внимание, че на страницата по-долу се показва и средната стойност в тези клетки.

По този начин има много начини да намерите средната стойност, просто трябва да изберете най-добрия за вас и да го използвате постоянно.

В Excel, като използвате функцията AVERAGE, можете да изчислите простата средна аритметична стойност. За да направите това, трябва да въведете няколко стойности. Натиснете равно и изберете в категорията Статистически, сред които изберете функцията СРЕДНО



Също така, като използвате статистически формули, можете да изчислите среднопретеглената аритметична стойност, която се счита за по-точна. За да го изчислим, се нуждаем от стойностите на индикатора и честотата.

Как да намеря средната стойност в Excel?

Ситуацията е следната. Има следната таблица:

Защрихованите в червено колони съдържат числените стойности на оценките по предметите. В колоната " Среден резултат„Изисква се да се изчисли средната им стойност.
Проблемът е следният: има общо 60-70 обекта и някои от тях са на друг лист.
Погледнах в друг документ, средната стойност вече е изчислена, а в клетката има формула като
="име на лист"!|E12
но това беше направено от някакъв програмист, който беше уволнен.
Кажете ми, моля, кой разбира това.

Хектор

В реда с функции вмъквате "СРЕДНО" от предложените функции и избирате откъде да се изчислят (B6: N6) за Иванов например. Не знам със сигурност за съседните листове, но със сигурност това се съдържа в стандартната помощ на Windows

Кажете ми как да изчисля средната стойност в Word

Моля, кажете ми как да изчисля средната стойност в Word. А именно средната стойност на оценките, а не броят на хората, получили оценки.


Юлия павлова

Word може да направи много с макроси. Натиснете ALT+F11 и напишете макро програма.
Освен това Insert-Object... ще ви позволи да използвате други програми, дори Excel, за да създадете лист с таблица в документ на Word.
Но в този случай трябва да запишете числата си в колоната на таблицата и да поставите средната стойност в долната клетка на същата колона, нали?
За да направите това, вмъкнете поле в долната клетка.
Вмъкване на поле...-Формула
Съдържание на полето
[=СРЕДНО(ГОРЕ)]
връща средната стойност на сумата от клетките по-горе.
Ако полето е избрано и е натиснат десния бутон на мишката, то може да се актуализира, ако числата са се променили,
вижте кода или стойността на полето, променете кода директно в полето.
Ако нещо се обърка, изтрийте цялото поле в клетката и го създайте отново.
AVERAGE означава средно, ABOVE - около, тоест ред клетки отгоре.
Аз самият не знаех всичко това, но лесно го намерих в HELP, разбира се, като помислих малко.

За да намерите средната стойност в Excel (независимо дали е числова, текстова, процентна или друга стойност), има много функции. И всеки от тях има свои собствени характеристики и предимства. В крайна сметка в тази задача могат да се поставят определени условия.

Например, средните стойности на поредица от числа в Excel се изчисляват с помощта на статистически функции. Можете също така ръчно да въведете своя собствена формула. Нека разгледаме различни варианти.

Как да намерим средната аритметична стойност на числата?

За да намерите средното аритметично, трябва да съберете всички числа в набора и да разделите сбора на числото. Например оценките на ученик по информатика: 3, 4, 3, 5, 5. Какво се отнася за една четвърт: 4. Намерихме средното аритметично по формулата: \u003d (3 + 4 + 3 + 5 + 5) / 5.

Как да го направя бързо с помощта на функциите на Excel? Вземете например поредица от произволни числа в низ:

Или: направете клетката активна и просто въведете ръчно формулата: =СРЕДНО(A1:A8).

Сега нека видим какво още може да направи функцията AVERAGE.


Намерете средноаритметичната стойност на първите две и последните три числа. Формула: =СРЕДНО(A1:B1;F1:H1). Резултат:



Средно според условията

Условието за намиране на средноаритметичното може да бъде числен критерий или текстов критерий. Ще използваме функцията: =AVERAGEIF().

Намерете средната аритметична стойност на числа, които са по-големи или равни на 10.

Функция: =AVERAGEIF(A1:A8,">=10")


Резултатът от използването на функцията AVERAGEIF при условието ">=10":

Третият аргумент - "Диапазон на осредняване" - е пропуснат. Първо, не е задължително. Второ, анализираният от програмата диапазон съдържа САМО числови стойности. В клетките, посочени в първия аргумент, търсенето ще се извърши според условието, посочено във втория аргумент.

внимание! Критерият за търсене може да бъде зададен в клетка. И във формулата да направя препратка към него.

Нека намерим средната стойност на числата по текстовия критерий. Например, средните продажби на продукта "маси".

Функцията ще изглежда така: =AVERAGEIF($A$2:$A$12;A7;$B$2:$B$12). Обхват - колона с имена на продукти. Критерият за търсене е връзка към клетка с думата "таблици" (можете да вмъкнете думата "таблици" вместо връзка A7). Диапазон на осредняване - тези клетки, от които ще бъдат взети данни за изчисляване на средната стойност.

В резултат на изчисляване на функцията получаваме следната стойност:

внимание! За текстов критерий (условие) трябва да се посочи диапазонът на осредняване.

Как да изчислим среднопретеглената цена в Excel?

Как да разберем среднопретеглената цена?

Формула: =SUMPRODUCT(C2:C12,B2:B12)/SUM(C2:C12).


Използвайки формулата SUMPRODUCT, намираме общия приход след продажбата на цялото количество стоки. А функцията SUM - сумира количеството стоки. Като разделим общия приход от продажбата на стоки на общия брой единици стоки, намерихме среднопретеглената цена. Този индикатор отчита "тежестта" на всяка цена. Нейният дял в обща масастойности.

Стандартно отклонение: формула в Excel

Правете разлика между стандартното отклонение за генералната съвкупност и за извадката. В първия случай това е коренът на общата дисперсия. Във втория, от извадката дисперсия.

За изчисляване на този статистически показател се съставя дисперсионна формула. От него се взема коренът. Но в Excel има готова функция за намиране на стандартното отклонение.


Стандартното отклонение е свързано с мащаба на изходните данни. Това не е достатъчно за образно представяне на вариацията на анализирания диапазон. За да се получи относителното ниво на разсейване в данните, се изчислява коефициентът на вариация:

стандартно отклонение / средно аритметично

Формулата в Excel изглежда така:

STDEV (диапазон от стойности) / AVERAGE (диапазон от стойности).

Коефициентът на вариация се изчислява като процент. Затова задаваме процентния формат в клетката.

Средно аритметично - статистически показател, който показва средната стойност на даден масив от данни. Такъв индикатор се изчислява като дроб, чийто числител е сумата от всички стойности на масива, а знаменателят е техният брой. Средната аритметична стойност е важен коефициент, който се използва при изчисленията на домакинствата.

Значението на коеф

Средната аритметична стойност е елементарен показател за сравняване на данни и изчисляване на приемлива стойност. Например, кутия бира от определен производител се продава в различни магазини. Но в един магазин струва 67 рубли, в друг - 70 рубли, в трети - 65 рубли, а в последния - 62 рубли. Има доста голям диапазон от цени, така че купувачът ще се интересува от средната цена на кутия, така че при закупуване на продукт да може да сравни разходите си. Средно една кутия бира в града има цена:

Средна цена = (67 + 70 + 65 + 62) / 4 = 66 рубли.

Познавайки средната цена, лесно е да определите къде е изгодно да купувате стоки и къде ще трябва да надплатите.

Средната аритметична стойност се използва постоянно в статистическите изчисления в случаите, когато се анализира хомогенен набор от данни. В горния пример това е цената на кутия бира от същата марка. Не можем обаче да сравняваме цената на бирата от различни производители или цените на бирата и лимонадата, тъй като в този случай разпространението на стойностите ще бъде по-голямо, средната цена ще бъде замъглена и ненадеждна, а самият смисъл на изчисленията ще бъде изкривена до карикатурата "средна температура в болницата". За изчисляване на разнородни масиви от данни се използва средноаритметично претеглено, когато всяка стойност получава свой собствен коефициент на тежест.

Изчисляване на средно аритметично

Формулата за изчисление е изключително проста:

P = (a1 + a2 + … an) / n,

където an е стойността на количеството, n е общият брой стойности.

За какво може да се използва този индикатор? Първата и очевидна употреба е в статистиката. Почти всяко статистическо изследване използва средно аритметично. Може да бъде средна възрастбрак в Русия, средната оценка по предмет за ученик или средните разходи за хранителни стоки на ден. Както бе споменато по-горе, без да се вземат предвид теглата, изчисляването на средните може да даде странни или абсурдни стойности.

Например президентът Руска федерациянаправи изявление, че според статистиката средната заплата на руснак е 27 000 рубли. За повечето хора в Русия това ниво на заплата изглеждаше абсурдно. Не е изненадващо, ако изчислението вземе предвид доходите на олигарси, ръководители на промишлени предприятия, големи банкери, от една страна, и заплатите на учители, чистачи и продавачи, от друга. Дори средните заплати в една специалност, например счетоводител, ще имат сериозни разлики в Москва, Кострома и Екатеринбург.

Как да изчислим средни стойности за разнородни данни

В ситуации на броене заплативажно е да вземете предвид тежестта на всяка стойност. Това означава, че заплатите на олигарсите и банкерите ще получат тежест например 0,00001, а заплатите на продавачите ще бъдат 0,12. Това са цифри от тавана, но те грубо илюстрират преобладаването на олигарсите и продажниците в руското общество.

По този начин, за да се изчисли средната стойност на средните стойности или средната стойност в разнороден масив от данни, е необходимо да се използва среднопретеглената аритметична стойност. В противен случай ще получите средна заплата в Русия на ниво от 27 000 рубли. Ако искате да знаете средната си оценка по математика или средния брой отбелязани голове от избран хокеист, тогава средноаритметичният калкулатор ще ви подхожда.

Нашата програма е прост и удобен калкулатор за изчисляване на средно аритметично. Трябва само да въведете стойности на параметрите, за да извършите изчисления.

Нека да разгледаме няколко примера

Изчисляване на средна оценка

Много учители използват средноаритметичния метод за определяне на годишна оценка по даден предмет. Да си представим, че едно дете получава следните четвърти оценки по математика: 3, 3, 5, 4. Каква годишна оценка ще му постави учителят? Нека използваме калкулатор и изчислим средноаритметичното. Първо изберете съответния брой полета и въведете стойностите на оценката в появилите се клетки:

(3 + 3 + 5 + 4) / 4 = 3,75

Учителят ще закръгли стойността в полза на ученика, а ученикът ще получи солидна четворка за годината.

Изчисляване на изядените сладкиши

Нека да илюстрираме някакъв абсурд на средното аритметично. Представете си, че Маша и Вова са имали 10 сладкиши. Маша изяде 8 бонбона, а Вова само 2. Колко бонбона изяде средно всяко дете? С помощта на калкулатор е лесно да се изчисли, че средно децата са изяли по 5 сладки, което е напълно невярно и разумно. Този пример показва, че средната аритметична стойност е важна за смислени набори от данни.

Заключение

Изчисляването на средноаритметичната стойност се използва широко в много научни области. Този показател е популярен не само в статистическите изчисления, но и във физиката, механиката, икономиката, медицината или финансите. Използвайте нашите калкулатори като помощник за решаване на средноаритметични задачи.

В повечето случаи данните са концентрирани около някаква централна точка. По този начин, за да се опише всеки набор от данни, е достатъчно да се посочи средната стойност. Разгледайте последователно три числени характеристики, които се използват за оценка на средната стойност на разпределението: средно аритметично, медиана и мода.

Средно аритметично

Средната аритметична стойност (често наричана просто средна) е най-често срещаната оценка на средната стойност на разпределение. Това е резултат от разделянето на сумата от всички наблюдавани числови стойности на техния брой. За проба на числата X 1, X 2, ..., Xн, средната стойност на извадката (обозначена със символа ) равно на \u003d (X 1 + X 2 + ... + Xн) / н, или

къде е средната стойност на извадката, н- размер на извадката, хазi-ти елементпроби.

Изтеглете бележка в или формат, примери във формат

Помислете за изчисляване на средната аритметична стойност на петгодишната средна годишна възвръщаемост на 15 взаимни фонда с много високо нивориск (фиг. 1).

Ориз. 1. Средна годишна доходност на 15 взаимни фонда с много висок риск

Средната стойност на извадката се изчислява, както следва:

Това е добра възвръщаемост, особено в сравнение с 3-4% възвръщаемост, която вложителите в банка или кредитен съюз са получили за същия период от време. Ако сортирате стойностите на възвращаемостта, лесно можете да видите, че осем фонда имат доходност над, а седем - под средната. Средната аритметична стойност действа като точка на баланс, така че фондовете с ниски доходи балансират фондовете с високи доходи. Всички елементи на извадката участват в изчисляването на средната стойност. Нито един от другите оценители на средната стойност на разпределението няма това свойство.

Кога да се изчисли средноаритметичната стойност.Тъй като средноаритметичната стойност зависи от всички елементи на извадката, наличието на екстремни стойности значително влияе върху резултата. В такива ситуации средноаритметичната стойност може да изкриви значението на числовите данни. Следователно, когато се описва набор от данни, съдържащ екстремни стойности, е необходимо да се посочи медианата или средноаритметичното и медианата. Например, ако възвръщаемостта на фонда RS Emerging Growth бъде премахната от извадката, средната извадкова възвръщаемост на 14-те фонда намалява с почти 1% до 5,19%.

Медиана

Медианата е средната стойност на подреден масив от числа. Ако масивът не съдържа повтарящи се числа, тогава половината от неговите елементи ще бъдат по-малки от и половината повече от медианата. Ако извадката съдържа екстремни стойности, по-добре е да се използва медианата, а не средното аритметично, за да се оцени средната стойност. За да се изчисли медианата на извадка, тя първо трябва да бъде сортирана.

Тази формула е двусмислена. Резултатът му зависи от това дали числото е четно или нечетно. н:

  • Ако извадката съдържа нечетен брой елементи, медианата е (n+1)/2-ти елемент.
  • Ако извадката съдържа четен брой елементи, медианата се намира между двата средни елемента на извадката и е равна на средноаритметичната стойност, изчислена върху тези два елемента.

За да изчислим медианата за извадка от 15 взаимни фонда с много висок риск, първо трябва да сортираме необработените данни (Фигура 2). Тогава медианата ще бъде срещу номера на средния елемент на извадката; в нашия пример номер 8. Excel има специална функция =MEDIAN(), която работи и с неподредени масиви.

Ориз. 2. Медиана 15 средства

Така медианата е 6,5. Това означава, че половината от фондовете с много висок риск не надвишават 6,5, докато другата половина го правят. Имайте предвид, че медианата от 6,5 е малко по-голяма от медианата от 6,08.

Ако премахнем доходността на фонда RS Emerging Growth от извадката, тогава медианата на останалите 14 фонда ще намалее до 6,2%, тоест не толкова значително, колкото средноаритметичната (фиг. 3).

Ориз. 3. Медиана 14 средства

Мода

Терминът е въведен за първи път от Pearson през 1894 г. Fashion е числото, което се среща най-често в извадката (най-модерното). Модата описва добре например типичната реакция на шофьорите при светофар за спиране на движението. Класически пример за използване на модата е изборът на размера на произведената партида обувки или цвета на тапета. Ако едно разпределение има множество режими, тогава се казва, че е мултимодално или мултимодално (има два или повече „пика“). Мултимодалното разпределение предоставя важна информация за естеството на изследваната променлива. Например, в социологически проучвания, ако една променлива представлява предпочитание или отношение към нещо, тогава мултимодалността може да означава, че има няколко ясно различни мнения. Мултимодалността също е индикатор, че извадката не е хомогенна и че наблюденията могат да бъдат генерирани от две или повече „припокриващи се“ разпределения. За разлика от средноаритметичната стойност, отклоненията не влияят на режима. За непрекъснато разпределени случайни променливи, като средната годишна възвръщаемост на взаимните фондове, режимът понякога изобщо не съществува (или няма смисъл). Тъй като тези индикатори могат да приемат различни стойности, повтарящите се стойности са изключително редки.

Квартили

Квартилите са мерки, които най-често се използват за оценка на разпределението на данни, когато се описват свойствата на големи числени извадки. Докато медианата разделя подредения масив наполовина (50% от елементите на масива са по-малки от медианата и 50% са по-големи), квартилите разделят подредения набор от данни на четири части. Стойностите на Q 1, медианата и Q 3 са съответно 25-ти, 50-ти и 75-ти персентил. Първият квартил Q 1 е число, което разделя извадката на две части: 25% от елементите са по-малко от и 75% са повече от първия квартил.

Третият квартил Q 3 е число, което също разделя извадката на две части: 75% от елементите са по-малко от и 25% са повече от третия квартил.

За изчисляване на квартили във версии на Excel преди 2007 г. се използва функцията =QUARTILE(масив, част). Започвайки с Excel 2010, се прилагат две функции:

  • =QUARTILE.ON(масив, част)
  • =QUARTILE.EXC(масив, част)

Тези две функции дават малко по-различни стойности (Фигура 4). Например, когато се изчисляват квартилите на извадка, съдържаща данни за средната годишна доходност на 15 взаимни фонда с много висок риск, Q 1 = 1,8 или -0,7 съответно за QUARTILE.INC и QUARTILE.EXC. Между другото, функцията QUARTILE, използвана по-рано, съответства на модерна функцияКВАРТИЛ НА За да изчислите квартили в Excel с помощта на горните формули, масивът от данни може да бъде оставен неподреден.

Ориз. 4. Изчислете квартили в Excel

Нека отново подчертаем. Excel може да изчислява квартили за едномерни дискретна серия, съдържащ стойностите на случайна променлива. Изчисляването на квартилите за базирано на честота разпределение е дадено в раздела по-долу.

средно геометрично

За разлика от средното аритметично, средното геометрично измерва колко се е променила дадена променлива във времето. Средната геометрична е коренът нстепен от продукта нстойности (в Excel се използва функцията = CUGEOM):

Ж= (X 1 * X 2 * ... * X n) 1/n

Подобен параметър - средното геометрично на нормата на възвръщаемост - се определя по формулата:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

където R i- норма на възвръщаемост аз-ти период от време.

Да предположим например, че първоначалната инвестиция е $100 000. До края на първата година тя спада до $50 000, а до края на втората година се възстановява до първоначалните $100 000. Процентът на възвръщаемост на тази инвестиция за два годишен период е равен на 0, тъй като първоначалната и крайната сума на средствата са равни една на друга. Въпреки това, средната аритметична годишни ставкипечалбата е = (-0,5 + 1) / 2 = 0,25 или 25%, тъй като нормата на възвръщаемост през първата година R 1 = (50 000 - 100 000) / 100 000 = -0,5, а през втората R 2 = (100 000 – 50 000) / 50 000 = 1. В същото време средната геометрична стойност на нормата на възвръщаемост за две години е: G = [(1–0,5) * (1+1)] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Така средното геометрично отразява по-точно изменението (по-точно липсата на изменение) в обема на инвестициите през двугодишния период, отколкото средното аритметично.

Интересни факти.Първо, средното геометрично винаги ще бъде по-малко от средното аритметично на същите числа. С изключение на случая, когато всички взети числа са равни едно на друго. Второ, като се имат предвид свойствата правоъгълен триъгълник, можете да разберете защо средната се нарича геометрична. Височината на правоъгълен триъгълник, спусната до хипотенузата, е средната пропорционална стойност между проекциите на катетите върху хипотенузата, а всеки катет е средната пропорционална стойност между хипотенузата и неговата проекция върху хипотенузата (фиг. 5). Това дава геометричен начин за конструиране на средното геометрично на два (дължини) сегмента: трябва да изградите окръжност върху сумата от тези два сегмента като диаметър, след това височината, възстановена от точката на тяхната връзка до пресечната точка с кръг, ще даде желаната стойност:

Ориз. 5. Геометричният характер на средното геометрично (фигура от Wikipedia)

Второто важно свойство на числовите данни е тяхното вариацияхарактеризиращ степента на дисперсия на данните. Две различни проби могат да се различават както по средни стойности, така и по вариации. Въпреки това, както е показано на фиг. 6 и 7, две проби могат да имат една и съща вариация, но различни средни стойности, или една и съща средна и напълно различна вариация. Данните, съответстващи на многоъгълник B на фиг. 7 се променят много по-малко от данните, от които е построен полигон А.

Ориз. 6. Две симетрични камбановидни разпределения с еднакво разпространение и различни средни стойности

Ориз. 7. Две симетрични камбановидни разпределения с еднакви средни стойности и различно разсейване

Има пет оценки за вариация на данните:

обхват

Диапазонът е разликата между най-големия и най-малкия елемент на извадката:

Плъзнете = XМакс-XМин

Диапазонът на извадка, съдържаща средната годишна доходност на 15 взаимни фонда с много висок риск, може да бъде изчислен с помощта на подреден масив (вижте Фигура 4): диапазон = 18,5 - (-6,1) = 24,6. Това означава, че разликата между най-високата и най-ниската средна годишна доходност за фондовете с много висок риск е 24,6%.

Диапазонът измерва общото разпространение на данните. Въпреки че обхватът на извадката е много проста оценка на общото разпространение на данните, неговата слабост е, че не взема предвид точно как данните са разпределени между минималния и максималния елемент. Този ефект се вижда добре на фиг. 8, която илюстрира проби със същия диапазон. Скалата B показва, че ако извадката съдържа поне една екстремна стойност, диапазонът на извадката е много неточна оценка на разсейването на данните.

Ориз. 8. Сравнение на три проби с еднакъв диапазон; триъгълникът символизира опората на баланса, а местоположението му съответства на средната стойност на пробата

Интерквартилен диапазон

Интерквартилът или средният диапазон е разликата между третия и първия квартил на извадката:

Интерквартилен диапазон \u003d Q 3 - Q 1

Тази стойност позволява да се оцени разпространението на 50% от елементите и да не се отчита влиянието на екстремни елементи. Интерквартилният диапазон за извадка, съдържаща данни за средната годишна възвръщаемост на 15 много високорискови взаимни фонда, може да бъде изчислен с помощта на данните на фиг. 4 (например за функцията QUARTILE.EXC): Интерквартилен диапазон = 9,8 - (-0,7) = 10,5. Интервалът между 9,8 и -0,7 често се нарича средна половина.

Трябва да се отбележи, че стойностите на Q 1 и Q 3, а оттам и междуквартилният обхват, не зависят от наличието на извънредни стойности, тъй като тяхното изчисление не взема предвид стойност, която би била по-малка от Q 1 или по-голяма от Q 3 . Общите количествени характеристики, като медианата, първия и третия квартил и интерквартилния диапазон, които не се влияят от извънредни стойности, се наричат ​​стабилни индикатори.

Докато обхватът и интерквартилният обхват предоставят съответно оценка на общото и средното разсейване на извадката, нито една от тези оценки не отчита точно как са разпределени данните. Дисперсия и стандартно отклонениесвободен от този недостатък. Тези индикатори ви позволяват да оцените степента на колебание на данните около средната стойност. Дисперсия на извадкатае приближение на средната аритметична стойност, изчислена от квадратните разлики между всеки елемент на извадката и средната извадка. За извадка от X 1 , X 2 , ... X n дисперсията на извадката (означена със символа S 2 се дава със следната формула:

Като цяло дисперсията на извадката е сумата от квадратите на разликите между елементите на извадката и средната извадка, разделена на стойност, равна на размера на извадката минус едно:

където - средноаритметично, н- размер на извадката, X i - аз-ти примерен елемент х. В Excel преди версия 2007 функцията =VAR() се използва за изчисляване на дисперсията на извадката, от версия 2010 се използва функцията =VAR.V().

Най-практичната и широко приета оценка на разсейването на данните е стандартно отклонение. Този показател се обозначава със символа S и е равен на корен квадратенот дисперсията на извадката:

В Excel преди версия 2007 функцията =STDEV() се използва за изчисляване на стандартното отклонение, от версия 2010 се използва функцията =STDEV.V(). За да се изчислят тези функции, масивът от данни може да бъде неподреден.

Нито дисперсията на извадката, нито стандартното отклонение на извадката могат да бъдат отрицателни. Единствената ситуация, при която показателите S 2 и S могат да бъдат нула, е ако всички елементи на извадката са равни. В този напълно невероятен случай диапазонът и интерквартилният диапазон също са нула.

Числовите данни по своята същност са непостоянни. Всяка променлива може да приема много различни стойности. Например различните взаимни фондове имат различни нива на възвръщаемост и загуба. Поради променливостта на числените данни е много важно да се изследват не само оценките на средната стойност, които са обобщаващи по природа, но и оценките на дисперсията, които характеризират разсейването на данните.

Дисперсията и стандартното отклонение ни позволяват да оценим разпространението на данните около средната стойност, с други думи, да определим колко елемента от извадката са по-малки от средната и колко са по-големи. Дисперсията има някои ценни математически свойства. Стойността му обаче е квадрат на единица мярка - квадратен процент, квадратен долар, квадратен инч и т.н. Следователно естествена оценка на дисперсията е стандартното отклонение, което се изразява в обичайните мерни единици - процент от дохода, долари или инчове.

Стандартното отклонение ви позволява да оцените степента на колебание на елементите на извадката около средната стойност. В почти всички ситуации по-голямата част от наблюдаваните стойности са в рамките на плюс или минус едно стандартно отклонение от средната стойност. Следователно, знаейки средното аритметично на елементите на извадката и стандартното отклонение на извадката, е възможно да се определи интервалът, към който принадлежи по-голямата част от данните.

Стандартното отклонение на възвръщаемостта на 15 взаимни фонда с много висок риск е 6,6 (Фигура 9). Това означава, че доходността на по-голямата част от фондовете се различава от средната стойност с не повече от 6,6% (т.е. тя варира в диапазона от - С= 6,2 – 6,6 = –0,4 до +S= 12,8). Всъщност този интервал съдържа петгодишна средна годишна възвръщаемост от 53,3% (8 от 15) средства.

Ориз. 9. Стандартно отклонение

Обърнете внимание, че в процеса на сумиране на квадратните разлики елементите, които са по-далеч от средната стойност, получават по-голяма тежест от елементите, които са по-близо. Това свойство е основната причина, поради която средната аритметична стойност най-често се използва за оценка на средната стойност на разпределение.

Коефициентът на вариация

За разлика от предишните оценки на разсейването, коефициентът на вариация е относителна оценка. Винаги се измерва като процент, а не в оригиналните единици данни. Коефициентът на вариация, означен със символите CV, измерва разсейването на данните около средната стойност. Коефициентът на вариация е равен на стандартното отклонение, разделено на средната аритметична стойност и умножено по 100%:

където С- стандартно отклонение на извадката, - извадкова средна стойност.

Коефициентът на вариация ви позволява да сравните две проби, чиито елементи са изразени в различни мерни единици. Например, мениджърът на услуга за доставка на поща възнамерява да обнови автопарка от камиони. Когато зареждате пакети, има два вида ограничения, които трябва да имате предвид: теглото (в паундове) и обемът (в кубични футове) на всеки пакет. Да предположим, че в проба, съдържаща 200 пакета, средно теглое 26,0 паунда, стандартното отклонение на теглото е 3,9 паунда, средният обем на опаковката е 8,8 кубически фута, а стандартното отклонение на обема е 2,2 кубични фута. Как да сравним разпределението на теглото и обема на пакетите?

Тъй като мерните единици за тегло и обем се различават една от друга, мениджърът трябва да сравни относителното разпространение на тези стойности. Коефициентът на вариация на теглото е CV W = 3,9 / 26,0 * 100% = 15%, а коефициентът на вариация на обема CV V = 2,2 / 8,8 * 100% = 25%. По този начин относителното разсейване на обемите на пакетите е много по-голямо от относителното разсейване на техните тегла.

Форма за разпространение

Третото важно свойство на извадката е формата на нейното разпределение. Това разпределение може да бъде симетрично или асиметрично. За да се опише формата на разпределение, е необходимо да се изчисли неговата средна стойност и медиана. Ако тези две мерки са еднакви, се казва, че променливата е симетрично разпределена. Ако средната стойност на дадена променлива е по-голяма от медианата, нейното разпределение има положителна асиметрия (фиг. 10). Ако медианата е по-голяма от средната, разпределението на променливата е отрицателно изкривено. Положителна асиметрия възниква, когато средната стойност се увеличи до необичайно високи стойности. Отрицателна асиметрия възниква, когато средната стойност намалее до необичайно малки стойности. Една променлива е симетрично разпределена, ако не приема никакви екстремни стойности в нито една посока, така че големи и малки стойности на променливата взаимно се компенсират.

Ориз. 10. Три вида разпределения

Данните, изобразени по скала А, имат отрицателна асиметрия. Тази фигура показва дълга опашка и ляво изкривяване, причинено от необичайно малки стойности. Тези изключително малки стойности изместват средната стойност наляво и тя става по-малка от медианата. Данните, показани в скала B, са разпределени симетрично. Лявата и дясната половина на разпределението са техни собствени огледални отражения. Големите и малките стойности се балансират взаимно, а средната и медианата са равни. Данните, показани на скала B, имат положителна асиметрия. Тази фигура показва дълга опашка и изкривяване надясно, причинено от наличието на необичайно високи стойности. Тези твърде големи стойности изместват средната стойност надясно и тя става по-голяма от медианата.

В Excel може да се получи описателна статистика с помощта на добавката Пакет за анализ. Преминете през менюто ДанниАнализ на данни, в прозореца, който се отваря, изберете реда Описателна статистикаи щракнете Добре. В прозореца Описателна статистикане забравяйте да посочите интервал на въвеждане(фиг. 11). Ако искате да видите описателна статистика на същия лист като оригиналните данни, изберете бутона за избор изходен интервали посочете клетката, където искате да поставите горния ляв ъгъл на показаната статистика (в нашия пример $C$1). Ако искате да изведете данни в нов лист или към нова книгапросто изберете съответния бутон за избор. Поставете отметка в квадратчето до Крайна статистика. По желание можете също да изберете Ниво на трудност,k-тото най-малко иk-то по големина.

Ако е на депозит Даннив района Анализне виждате иконата Анализ на данни, първо трябва да инсталирате добавката Пакет за анализ(виж, например,).

Ориз. 11. Описателна статистика на петгодишната средна годишна доходност на фондове с много високи нива на риск, изчислена с помощта на добавката Анализ на данни Excel програми

Excel изчислява редица статистически данни, обсъдени по-горе: средна стойност, медиана, режим, стандартно отклонение, дисперсия, диапазон ( интервал), минимум, максимум и размер на извадката ( проверка). Освен това Excel изчислява някои нови статистики за нас: стандартна грешка, ексцес и изкривяване. стандартна грешкае равно на стандартното отклонение, разделено на корен квадратен от размера на извадката. Асиметрияхарактеризира отклонението от симетрията на разпределението и е функция, която зависи от куба на разликите между елементите на извадката и средната стойност. Ексцесът е мярка за относителната концентрация на данни около средната стойност спрямо опашките на разпределението и зависи от разликите между извадката и средната стойност, повишена на четвърта степен.

Изчисляване на описателна статистика за генералната съвкупност

Средната стойност, разсейването и формата на разпределението, обсъдени по-горе, са характеристики, базирани на извадка. Въпреки това, ако наборът от данни съдържа числени измервания на цялата популация, тогава неговите параметри могат да бъдат изчислени. Тези параметри включват средна стойност, дисперсия и стандартно отклонение на популацията.

Очаквана стойносте равна на сумата от всички стойности на генералната съвкупност, разделена на обема на генералната съвкупност:

където µ - очаквана стойност, хаз- аз-та променлива наблюдение х, н- обемът на генералната съвкупност. В Excel за изчисляване на математическото очакване се използва същата функция като за средното аритметично: =AVERAGE().

Дисперсия на населениеторавна на сумата от квадратите на разликите между елементите на генералната съвкупност и мат. очакване, разделено на размера на населението:

където σ2е дисперсията на генералната съвкупност. Excel преди версия 2007 използва функцията =VAR() за изчисляване на дисперсията на популацията, започвайки с версия 2010 =VAR.G().

стандартно отклонение на населениетое равно на корен квадратен от дисперсията на популацията:

Excel преди версия 2007 използва =STDEV() за изчисляване на стандартното отклонение на популацията, като се започне от версия 2010 =STDEV.Y(). Обърнете внимание, че формулите за вариация на популацията и стандартно отклонение са различни от формулите за вариация на извадката и стандартно отклонение. При изчисляване на извадкова статистика S2и Сзнаменателят на дробта е n - 1, и при изчисляване на параметрите σ2и σ - обемът на генералната съвкупност н.

основно правило

В повечето ситуации голяма част от наблюденията са концентрирани около медианата, образувайки клъстер. В набори от данни с положителна асиметрия, този клъстер е разположен вляво (т.е. под) от математическото очакване, а в набори с отрицателна асиметрия този клъстер е разположен вдясно (т.е. отгоре) на математическото очакване. Симетричните данни имат една и съща средна стойност и медиана, а наблюденията се групират около средната стойност, образувайки разпределение във формата на камбана. Ако разпределението няма ясно изразено изкривяване и данните са концентрирани около определен център на тежестта, може да се използва правило за оценка на променливостта, което гласи: ако данните имат камбанообразно разпределение, тогава приблизително 68% от наблюденията са по-малко от едно стандартно отклонение от математическото очакване, Приблизително 95% от наблюденията са в рамките на две стандартни отклонения от очакваната стойност, а 99,7% от наблюденията са в рамките на три стандартни отклонения от очакваната стойност.

По този начин стандартното отклонение, което е оценка на средната флуктуация около математическото очакване, помага да се разбере как са разпределени наблюденията и да се идентифицират отклоненията. От основното правило следва, че за камбанообразните разпределения само една от двадесет стойности се различава от математическото очакване с повече от две стандартни отклонения. Следователно стойности извън интервала µ ± 2σ, могат да се считат за извънредни стойности. Освен това само три от 1000 наблюдения се различават от математическото очакване с повече от три стандартни отклонения. По този начин стойностите са извън интервала µ ± 3σпочти винаги са отклонения. За разпределения, които са силно изкривени или не са с форма на камбана, може да се приложи основното правило на Biename-Chebyshev.

Преди повече от сто години математиците Биенамай и Чебишев откриха независимо един от друг полезно свойствостандартно отклонение. Те откриха, че за всеки набор от данни, независимо от формата на разпределението, процентът наблюдения, които се намират на разстояние, което не надвишава кстандартни отклонения от математическото очакване, не по-малко (1 – 1/ 2)*100%.

Например ако к= 2, правилото на Biename-Chebyshev гласи, че най-малко (1 - (1/2) 2) x 100% = 75% от наблюденията трябва да се намират в интервала µ ± 2σ. Това правило е вярно за всеки кнадвишава едно. Правилото Biename-Chebyshev е много общ характери е валиден за дистрибуции от всякакъв вид. То показва минимално количествонаблюдения, разстоянието от които до математическото очакване не надвишава зададена стойност. Въпреки това, ако разпределението е с форма на камбана, основното правило оценява по-точно концентрацията на данни около средната стойност.

Изчисляване на описателна статистика за честотно базирано разпределение

Ако оригиналните данни не са налични, разпределението на честотата става единственият източник на информация. В такива ситуации можете да изчислите приблизителните стойности на количествените показатели на разпределението, като средно аритметично, стандартно отклонение, квартили.

Ако примерните данни са представени като честотно разпределение, може да се изчисли приблизителна стойност на средната аритметична стойност, като се приеме, че всички стойности във всеки клас са концентрирани в средната точка на класа:

където - извадкова средна стойност, н- брой наблюдения или размер на извадката, с- броя на класовете в честотното разпределение, mj- средна точка й-ти клас, fй- честота, съответстваща на й-ти клас.

За да се изчисли стандартното отклонение от честотното разпределение, също се приема, че всички стойности във всеки клас са концентрирани в средната точка на класа.

За да разберем как се определят квартилите на реда въз основа на честотите, нека разгледаме изчисляването на долния квартил въз основа на данните за 2013 г. за разпределението на руското население по среден паричен доход на глава от населението (фиг. 12).

Ориз. 12. Делът на населението на Русия с паричен доход на глава от населението средно на месец, рубли

За да изчислите първия квартил от серията интервални вариации, можете да използвате формулата:

където Q1 е стойността на първия квартил, xQ1 е долната граница на интервала, съдържащ първия квартил (интервалът се определя от натрупаната честота, като първата надвишава 25%); i е стойността на интервала; Σf е сумата от честотите на цялата извадка; вероятно винаги е равно на 100%; SQ1–1 е кумулативната честота на интервала, предхождащ интервала, съдържащ долния квартил; fQ1 е честотата на интервала, съдържащ долния квартил. Формулата за третия квартил се различава по това, че на всички места, вместо Q1, трябва да използвате Q3 и да замените ¾ вместо ¼.

В нашия пример (фиг. 12) долният квартил е в диапазона 7000,1 - 10 000, чиято кумулативна честота е 26,4%. Долната граница на този интервал е 7000 рубли, стойността на интервала е 3000 рубли, натрупаната честота на интервала, предхождащ интервала, съдържащ долния квартил, е 13,4%, честотата на интервала, съдържащ долния квартил, е 13,0%. Така: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \u003d 9677 рубли.

Клопки, свързани с описателната статистика

В тази бележка разгледахме как да опишем набор от данни, използвайки различни статистики, които оценяват неговата средна стойност, разсейване и разпределение. Следващата стъпка е да анализирате и интерпретирате данните. Досега изучавахме обективните свойства на данните, а сега се обръщаме към тяхната субективна интерпретация. Две грешки чакат изследователя: неправилно избран предмет на анализ и неправилно тълкуване на резултатите.

Анализът на представянето на 15 взаимни фонда с много висок риск е доста безпристрастен. Той доведе до напълно обективни заключения: всички взаимни фондове имат различна доходност, спредът на доходността на фондовете варира от -6,1 до 18,5, а средната доходност е 6,08. Обективността на анализа на данните се осигурява от правилния избор на общите количествени показатели на разпределението. Бяха разгледани няколко метода за оценка на средната стойност и разсейването на данните и бяха посочени техните предимства и недостатъци. Как да изберем правилната статистика, която предоставя обективен и безпристрастен анализ? Ако разпределението на данните е леко изкривено, трябва ли медианата да бъде избрана пред средната аритметична? Кой индикатор характеризира по-точно разпространението на данните: стандартно отклонение или диапазон? Трябва ли да се посочи положителната асиметрия на разпределението?

От друга страна, интерпретацията на данни е субективен процес. Различните хора стигат до различни заключения, тълкувайки едни и същи резултати. Всеки си има своя гледна точка. Някой смята общата средна годишна доходност на 15 фонда с много високо ниво на риск за добра и е доста доволен от получения доход. Други може да си помислят, че тези фондове имат твърде ниска възвръщаемост. Така субективизмът трябва да се компенсира от честност, неутралност и яснота на заключенията.

Етични въпроси

Анализът на данни е неразривно свързан с етичните въпроси. Човек трябва да бъде критичен към информацията, разпространявана от вестници, радио, телевизия и интернет. С времето ще се научите да бъдете скептични не само към резултатите, но и към целите, предмета и обективността на изследването. Известният британски политик Бенджамин Дизраели го каза най-добре: „Има три вида лъжи: лъжи, проклети лъжи и статистика.

Както е отбелязано в бележката, етични проблеми възникват при избора на резултатите, които трябва да бъдат представени в доклада. Трябва да се публикуват както положителните, така и отрицателните резултати. Освен това, когато се прави доклад или писмен доклад, резултатите трябва да бъдат представени честно, неутрално и обективно. Правете разлика между лоши и нечестни презентации. За целта е необходимо да се определи какви са били намеренията на говорещия. Понякога говорещият пропуска важна информация поради незнание, а понякога и умишлено (например, ако използва средната аритметична стойност, за да оцени средната стойност на ясно изкривени данни, за да получи желания резултат). Също така е нечестно да се премълчават резултати, които не отговарят на гледната точка на изследователя.

Използвани са материали от книгата Левин и др.Статистика за мениджъри. - М.: Уилямс, 2004. - стр. 178–209

Функцията QUARTILE е запазена за привеждане в съответствие с по-ранните версии на Excel



Какво друго да чета