Все о тюнинге авто

1 этапом статистического исследования является. Статистическая методология и этапы статистического исследования

Статистическое наблюдение заключается в сборе первич­ного статистического материала, в научно организованной регистрации всех существенных фактов, относящихся к рассмат­риваемому объекту. Это первый этап всякого статистического исследования.

Метод группировок дает возможность все собранные в результате массового статистического наблюдения факты подвергать систематизации и классификации. Это второй этап статистического исследования.

Метод обобщающих показателей позволяет харак­теризовать изучаемые явления и процессы при помощи статистических величин - абсолютных, относительных и средних. На этом этапе статистического исследования выявляются взаимосвязи и масштабы явлений, определяются законо­мерности их развития, даются прогнозные оценки.

На первом этапе статистического исследования форми­руются первичные статистические данные, или исходная статистическая информация, которая является фундаментом будущего статистического здания. Чтобы здание было прочным, добротной и качественной должна быть его основа. Если при сборе первичных статистических данных допущена ошибка или материал оказался недоброкачественным, это повлияет на правильность и достоверность как теоретических, так и практических выводов. Поэтому, статистическое наблюдение от начальной до завершающей стадии - получения итоговых материалов - должно быть тщательно продуманным и четко ооганизованным. Статистическое наблюдение дает исходный материал для обобщения, началом которого служит сводка. Если при статистическом наблюдении о каждой его единице получают сведения, характеризующие ее с многих сторон, то данные сводки характеризуют всю статистическую совокупность и отдельные ее части. На этой стадии совокупность делится по признакам различия и объединяется по признакам сходства, подсчитываются суммарные показатели по группам и в целом. С помощью метода группировок изучаемые явления делятся на важнейшие типы, характерные группы и подгруппы по существенным признакам. С помощью группировок ограничивают качественно однородные в существенном отношении совокупности, что является предпосылкой для определения и применения обобщающих показателей.

На заключительном этапе анализа с помощью обобщающих показателей рассчитываются относительные и средние величины, дается сводная оценка вариации признаков, характеризуется динамика явлений, применяются индексы, балансовые построения, рассчитываются показатели, характеризующие тесноту связей в изменении признаков. С целью наиболее рационального и наглядного изложения цифрового материала он представляется в виде таблиц и графиков.

Статистическое наблюдение - первый этап статистического исследования

Статистическое наблюдение - это первая стадия всякого статистического исследования, представляющая собой научно организованный по единой программе учет фактов, характе­ризующих явления и процессы общественной жизни, и сбор полученных на основе этого учета массовых данных.

Однако не всякий сбор сведений является статистическим наблюдением. О статистическом наблюдении можно говорить лишь тогда, когда изучаются статистические закономерности, т.е. такие, которые проявляются только в массовом процессе, в большом числе единиц какой-то совокупности. Поэтому статистическое наблюдение должно быть планомерным, массовым и систематическим.

Планомерность статистического наблюдения заключается в том, что оно готовится и проводится по разработанному плану, который включает вопросы методологии, организации, техники сбора информации, контроля за качеством собранного материала, его достоверности, оформления итоговых результатов. Массовый характер статистического наблюдения предполагает, что оно охватывает большое число случаев проявления данного процесса, достаточное для того, чтобы получить правдивые статистическиеданные, характеризующие не только отдельные единицы, но и всю совокупность в целом.

Наконец, систематичность статистического наблюдения определяется тем, что оно должно проводиться либо система­тически, либо непрерывно, либо регулярно. Изучение тенденций и закономерностей социально-экономических процессов, характеризующихся количественными и качественными изменениями, возможно лишь на этой основе. Из сказанного следует, что к статистическому наблюдению предъявляются следующие требования:

  • 1) полноты статистических данных (полноты охвата единиц изучаемой совокупности, сторон того или иного явления, а также полноты охвата во времени);
  • 2) достоверности и точности данных;
  • 3) их единообразия и сопоставимости.

Программно-методологические и организационные вопросы статистического наблюдения

Любое статистическое исследование необходимо начинать с точной формулировки его цели и конкретных задач, а тем самым и тех сведений, которые могут быть получены в процессе наблюдения. После этого определяются объект и единица наблюдения, разрабатывается программа, выбираются вид и способ наблюдения.

Обработка собранных первичных данных, включающая их группировку, обобщение и оформление в таблицах, составляет второй этап статистического исследования, который называется сводкой .

Существует 3 основных формы представления обработанных статистических данных: текстовая, табличная и графическая .

На третьем этапе статистического исследования на основе итоговых данных сводки осуществляется научный анализ исследуемых явлений : рассчитываются различные обобщающие показатели в виде средних и относительных величин, выявляются определенные закономерности в распределениях, динамике показателей и т. п. На основе выявленных закономерностей делаются прогнозы на будущее.

Статистическое наблюдение – первая стадия статистического исследования. Почти всегда, в соответствии, конечно, с целями и задачами исследования начинают работу с учета фактов и сбора первичного материала. Первичный материал – это фундамент статистического исследования. От качества статистического наблюдения зависит успех всего исследования в целом. Оно должно быть организовано таким образом, чтобы в результате были получены объективные, точные данные об изучаемом явлении. Неполные, неточные данные, недостаточно хорошо характеризующие процесс, тем более искажающие его приводят к ошибкам. И анализ, проведенный на такой основе – будет ошибочным. Отсюда следует, что учет фактов и сбор первичного материала должны быть тщательно продуманы и организованы.

Необходимо еще раз отметить, что статистические наблюдения – всегда массовые. В силу вступает закон больших чисел - чем больше совокупность, тем объективнее будут полученные результаты.

В статистическом наблюдении можно выделить три этапа: 1. Подготовка наблюдения. Это формулировка программы наблюдения, определение показателей, сгруппированных в макеты конечных статистических таблиц.

Вопросы, составляющие содержание программы, должны вытекать из цели исследования или гипотезы, подтверждению которой предполагается посвятить исследование. Важным элементом являются макеты конечных статистических таблиц. Именно они являются проектом разработки результатов наблюдения и только при их наличии можно выявить все вопросы, которые необходимо включить в программу и избежать включения ненужной информации.

2. Непосредственный сбор материала . Это самая трудоемкая стадия исследования. Статистическая отчетность, как особая форма организации сбора данных, присуща только государственной статистике. Вся иная информация собирается посредством разнообразного статического инструментария. Необходимо указать на два основных требования к собранным данным: достоверность и сопоставимость. И крайне желаемое (в условиях рынка оно возрастает многократно) – своевременность.



3. Контроль материала перед его анализом. Как бы тщательно не был составлен инструментарий наблюдения, проведен инструктаж исполнителей, всегда материалы наблюдения нуждаются в контроле. Это объясняется массовым характером статистических работ и сложностью их содержания.

Объектом любого статистического исследования является совокупность единиц изучаемого явления. Объектом может быть население при переписи, предприятия, города, персонал фирмы и т.д. Словом, объект наблюдения – исследуемая статистическая совокупность. Очень важно определить и границы изучаемой совокупности, которые четко определяют изучаемую совокупность. Например, если ставится цель изучить деятельность малых предприятий области, то следует определить, к какой форме собственности оно относится (государственное, частное, совместное и т.д.), по какому критерию будут отбираться предприятия: отраслевые особенности, объем реализации, время с момента регистрации, состояние (действующее, бездействующее, во временном простое) и т.д. Совокупность должна быть однородной, иначе в процессе анализа возникнут дополнительные сложности и почти всегда неминуемы ошибки.

Наряду с определением объектом наблюдения и границ важно определить единицу совокупности и единицу наблюдения. Единица совокупности – индивидуальный составной элемент статистической совокупности. Единица наблюдения – это то явление, объект, признаки которого подлежат регистрации. Совокупность единиц наблюдения составляет объект наблюдения. Например, цель: исследовать влияние разных факторов на производительность труда рабочих на шахтах ОАО «Испат-Кармет». В этом случае – совокупность определена самой целью – шахтеры, работающие на шахтах «Испат-Кармет», единицей совокупности является шахтер, как носитель информации, а единицей наблюдения является шахта. Кратко: единица совокупности – то, что подвергается обследованию, единица наблюдения – источник сведений.
Для осуществления статистического наблюдения необходимо произвести сбор данных по заданному признаку, а именно: обозначить статистическую совокупность, которая состоит из материально существующих объектов, единицу и цель единовременного обследования объекта, составить программу статистического наблюдения.



На первом этапе формируется выборка собранных данных по обозначенным признакам, данные упорядочиваются по возрастанию. Затем следует составить таблицу распределения частот с последовательным заполнением соответствующих столбцов в таблице.

На втором этапе для обработки собранных первичных данных необходимо произвести группировку и обобщение отобранных элементов по заданному признаку, обозначить числовые характеристики выборки. Этот этап статистического исследования называется сводка . Сводка – научная обработка первичных данных в целях получения обобщенных характеристик изучаемого явления по ряду существенных для него признаков, т. е. первичные материалы сводятся вместе, образуют статистические совокупности, которые характеризуются итоговыми абсолютными обобщающими показателями. На стадии сводки мы переходим от характеристики отдельных варьирующих признаков единиц совокупности – к характеристике всей совокупности в целом или к характеристике их общего проявления в массе.

Следует найти размах по формуле:

R=x(max) – x(min);

моду M(0), которая показывает значение, встречающееся чаще других, медиану M(e), которая характеризует среднее значение (его не превышает половина членов ряда) соответствует варианте, стоящей в середине ранжированного вариационного ряда. Положение медианы определяется ее номером:Nме = (n+1) /2 , где n – число единиц в совокупности и среднее арифметическое значение для обозначенной группы, которая вычисляется по формуле:

Результаты работы могут быть представлены графически в виде гистограммы и полигона распределения частот.

Полученные данные отражают то общее, что присуще всем единицам исследуемой совокупности. В результате статистического наблюдения должна быть получена объективная, сопоставимая, полная информация, позволяющая на последующих этапах исследования обеспечить научно-обоснованные выводы о характере и закономерностях развития изучаемого явления.

Практическое задание

Провести статистическое исследование, выяснив сведенья о росте 2 5 случайным образом выбранных студентовТомского политехнического университета.

Составить таблицу распределения частот, найти размах, моду, медиану и среднее арифметическое значение роста (в см) для обозначенных юношей.

Результатом первого этапа статистического исследования -- статистического наблюдения -- являются сведения, характеризующие каждую единицу статистической совокупности. Однако, возможности отразить закономерности и тенденции динамики изучаемых явлений с помощью даже самой полной характеристики единичных фактов ограничены. Такие данные получают только в результате статистической сводки. Сводка - это упорядочение, систематизация и обобщение статистических данных, полученных при статистическом наблюдении. Только надлежащая обработка статистического материала позволяет выявить сущность социально-экономических явлений, характерные черты и существенные особенности отдельных типов, обнаружить закономерности и тенденции их развития. Различают сводку простую и групповую, или сводку в узком и широком понимании. Простая сводка -- это подсчет общих итогов в группах и подгруппах и оформление этого материала в таблицы. В результате простой сводки статистических данных можно определить количество предприятий, общую численность персонала, объем произведенной продукции в денежном выражении. Эти общие итоги носят в основном информативный характер. Они дают обобщенную характеристику совокупности в виде абсолютных величин.

Групповая сводка, или сводка в широком понимании, представляет собой сложный процесс по многосторонней обработке первичных статистических данных, т.е. данных, полученных в результате наблюдения. Он включает группировку статистических данных, разработку системы показателей для характеристики групп, подсчет групповых и общих итогов, расчет обобщающих показателей. Задача статистической сводки как второго этапа статистического исследования - получение обобщающих показателей для информационно-справочных и аналитических целей. Сводка массовых статистических данных осуществляется по заранее разработанным программе и плану. В процессе разработки программы определяются подлежащее и сказуемое сводки. Подлежащее -- это объект исследования, расчлененный на группы и подгруппы. Сказуемое -- показатели, которые характеризуют подлежащее сводки. Программа сводки определяется задачами статистического исследования.

Статистическая сводка выполняется по заранее составленному плану. В плане сводки решаются вопросы о способах проведения работы по обобщению информации -- вручную или механизированным способом, о последовательности отдельных операций сводки. Устанавливаются сроки выполнения каждого этапа и сводки в целом, а также способы изложения результатов сводки. Это могут быть ряды распределения, статистические таблицы и статистические графики.

Статистическое исследование (СИ) позволяет получить представление о том или ином явлении, изучить его размер, уровень, выявить закономерности. Предметом СИ могут быть здоровье населения, организация медицинской помощи, факторы внешней среды, влияющие на здоровье и т. д.

При проведении СИ могут быть использованы 2 методических подхода :

1) изучение интенсивности явления в среде, распространенности явления, выявление тенденций состояния здоровья населения – проводятся на генеральных совокупностях или достаточно больших по численности выборочных совокупностях, позволяющих получить интенсивные показатели и обоснованно перенести полученные данные на всю генеральную совокупность

2) проведение строго спланированных исследований по изучению отдельных факторов без выявления интенсивности явления в среде – проводятся, как правило, на небольших по численности совокупностях с целью выявления новых факторов, изучения неизвестных или малоизвестных причинно-следственных связей

Этапы статистического исследования:

1 этап. Составление плана и программы исследования – является подготовительным, на нем определяется цель и задачи исследования, составляется план и программа иссле­дования, разрабатывается программа сводки статистического мате­риала и решаются организационные вопросы.

А) цель и задачи исследования должны быть четко сформулированы; цель определяет основное направление исследования и носит, как правило, не только теоретический, но и практический характер, она формулируется ясно, четко, недвусмысленно; для раскрытия поставленной цели определяются задачи исследова­ния.

Б) необходимо изучить по данной теме литературу.

В) необходимо разработать Организационный план – предус­матривает определение 1) места (административно-территориальных границ наблюдения), 2) времени (конкретных сроков осуществления наблю­дения, проведения разработки и анализа материала) и 3) субъекта ис­следования (организаторов, исполнителей, методического и органи­зационного руководства, источников финансирования исследования).

Г) разработка Плана исследования – включает определение:

– объекта исследования (статистической совокупнос­ти);

– объема исследования (сплошное, несплошное);

– видов (текущее, единовременное);

– способов сбора статистической информации.

Д) необходимо составить Программу исследования (наблюдения) – включает:

– определение единицы наблюдения;

– перечень вопросов (учетных признаков), подлежащих регистра­ции в отношении каждой единицы наблюдения

– разработку индивидуального учетного (регистрационного) блан­ка с перечнем вопросов и признаков, подлежащих учету;

– разработку макетов таблиц, в которые затем вносятся результа­ты исследования.

На каждую единицу наблюдения заполняется отдельный бланк, он содержит паспортную часть, четко сформулированные, поставленные в определенной последовательности вопросы программы и дату заполне­ния документа. В качестве учетных бланков могут быть использованы применяе­мые в практике лечебно-профилактических учреждений учетные меди­цинские формы.

Источниками получения информации могут служить другие медицин­ские документы (истории болезни, и индивидуальные карты амбула­торного больного, истории развития ребенка, истории родов), от­четные формы лечебно-профилактических учреждений и др.

Для обеспечения возможности статистической разработки данных из этих документов производят выкопировку сведений на специально разработанные учетные бланки, содержание которых определяется в каждом отдельном случае в соответствии с задачами исследования.

В настоящее время в связи с машинной обработкой результатов наблюдения с использованием ЭВМ вопросы программы могут быть формализованы, Когда вопросы в учетном документе ставятся в виде альтернативы (да, нет), Или предлагаются уже готовые ответы, из которых следует выбрать определенный ответ.

Е) необходимо составить программу сводки полученных данных, которая включает установление принципов группировки, выделение группировочных признаков, Определение комбинаций этих признаков, составление макетов статистических таблиц.

2 этап. Сбор материала (статистическое наблюдение) – – заключается в регистрации отдельных случаев изу­чаемого явления и характеризующих их учетных признаков в регис­трационные бланки. Перед и в ходе выполнения этой работы прово­дится инструктаж (устный или письменный) исполнителей наблюде­ния, обеспечение их формами регистрации.

Статистическое наблюдение может быть:

А) по времени :

1) Текущим – явление изучается за какой-то от­дельный период времени (неделю, квартал, Год и т. д.) путем пов­седневной регистрации явления по мере возникновения каждого слу­чая (учет числа родившихся, Умерших, заболевших, Выписанных из стационара). Так учиты­ваются быстро меняющиеся явления.

2) Единовременным – статистические данные собирают­ся на определенный (критический) момент времени (перепись населения, изучение физического развития детей, профилактические осмотры населения). Единовременная ре­гистрация отражает состояние явления на момент изучения, используется для изучения медленно меняющихся явлений.

Выбор вида наблюдения по времени определяется целью и задачами исследования (характеристику госпитализированных больных можно получить в результате текущей регистрации выбывших из стационара – текущее наблюдение или путем однодневной перепи­си больных, находящихся в стационаре – единовременное наблюдение).

Б) в зависимости от полноты охвата изучаемого явления :

1) Сплошное – изучаются все входящие в состав со­вокупности единицы наблюдения, т. е. генеральная совокупность. Проводят с целью установления абсолютных размеров явления (общей численности населения, общего количества родившихся или умерших). Применяется и в тех случаях, когда сведения необходимы для оперативной работы (учет инфекционной заболеваемости, нагрузка врачей и др.)

2) Несплошное – изучается лишь часть генеральной совокупности, делится на несколько видов:

1. Монографический метод – дает детальное описание отдельных ха­рактерных в каком-либо отношении единиц совокупности и глубокое, всестороннее описание объектов.

2. Метод основного массива – предполагает изучение тех объектов, в которых сосредоточено значительное большинство единиц наблюде­ния. Недостатком этого метода является то, что остается неохва­ченной исследованием часть совокупности, хотя и небольшая по размерам, но которая может значительно отличаться от основного мас­сива.

3. Анкетный метод – это сбор статистических данных с помощью спе­циально разработанных анкет, адресованных определенному кругу лиц. Это исследование основано на принципе добровольности, поэто­му возврат анкет зачастую бывает неполным. Нередко ответы на пос­тавленные вопросы носят отпечаток субъективности и случайности. Этот метод применяется для получения приблизительной характеристики изучаемого явления.

4. Выборочный метод – самый распространенный метод, сводится к исследованию некоторой спе­циально отобранной части единиц наблюдения для характеристики всей генеральной совокупности. Преимуществом этого метода являет­ся получение результатов высокой степени надежности, а также зна­чительно более низкая стоимость. В исследовании занято меньшее число исполнителей, Кроме того он требует меньших затрат времени. В медицинской статистике роль и место выборочного метода осо­бенно велики, поскольку медицинские работники имеют дело обычно только с частью изучаемого явления (изучают группу больных с тем или иным заболеванием, анализируют работу отдельных подразделе­ний).

В) по способу получения сведений в ходе проведения и характеру его осуществления

1. Непосредственное наблюдение (клинический осмотр больных, Проведение лабораторных, Инструментальных исследований, Антропо­метрические измерения и т. п.)

2. Социологические методы : метод интервью (очный опрос), анке­тирование (заочный опрос – анонимный или неанонимный) и др.;

3. Документальное исследование (выкопировка сведений из учет­но-отчетных медицинских документов, сведения официальной статис­тики учреждений и организаций.)

3 этап. Разработка материала, статистическая группировка и сводка – начинается с проверки и уточнения числа наблюдений, Полноты и правильности по­лученных сведений, Выявлении и устранении ошибок, дубликатов за­писей и т. д.

Для правильной разработки материала применяется Шифровка пер­вичных учетных документов , Т. е. обозначение каждого признака и его группы знаком – буквенным или цифровым. Шифровка – это техни­ческий прием, Облегчающий и ускоряющий разработку материала, По­вышающий качество, точность разработки. Шифры – условные обозна­чения – вырабатываются произвольно. При шифровке диагнозов реко­мендуется пользоваться международной номенклатурой и классифика­цией болезней; при шифровке профессий – словарем профессий.

Преимуществом шифровки является то, что при необходимости пос­ле окончания основной разработки можно вернуться к материалу для разработки с целью выяснения новых связей и зависимостей. Зашиф­рованный учетный материал позволяет сделать это легче и быстрее, Чем незашифрованный. После проверки проводится группировка призна­ков.

Группировка – расчленение совокупности изучаемых данных на од­нородные, Типичные группы по наиболее существенным признакам. Группировка может проводиться по качественным и количественным признакам. Выбор группировочного признака зависит от характера изучаемой совокупности и задач исследования.

А) Типологическая группировка производится по качественным (опи­сательным, атрибутивным) признакам (пол, Профессия, группы болезни)

Б) Вариационная группировка (по количественным признакам) прово­дится на основании числовых размеров признака (воз­раст, Длительность заболевания, продолжительность лечения и т. д.). Количественная группировка требует решения вопроса о величине группировочного интервала: интервал может быть равным, а в ряде случаев – неравный, даже включать так называемые открытые группы (при группировке по возрасту могут быть определены открытые группы: до 1 года, 50 лет и старше).

При определении числа групп исходят из цели и задач исследова­ния. Необходимо, чтобы группировки могли вскрыть закономерности изучаемого явления. Большое число групп может привести к чрезмер­ному дроблению материала, ненужной детализации. Малое число групп приводит к затушевыванию характерных черт.

Закончив группировку материала, приступают к Сводке – обобщение единичных случаев, Полученных в результате статистического исследования, в определенные группы, их подсчет и внесение в макеты таблиц.

Сводку статистического материала проводят при помощи статисти­ческих таблиц. Таблица, Не заполненная цифрами, Называется Макетом .

Статистические таблицы бывают перечневые, Хронологические, тер­риториальные.

Таблица имеет подлежащее и сказуемое. Статистическое подлежа­щее обычно размещается по горизонтальным строкам в левой части таблицы и отражает главный, основной признак. Статистическое ска­зуемое размещается слева направо по вертикальным графам и отра­жает дополнительные учетные признаки.

Статистические таблицы делятся на:

А) Простые – представлено числовое распределение мате­риала по одному признаку, Составных частей его. Простая таблица содержит обычно простой перечень или итог по всей сово­купности изучаемого явления.

Б) Групповые – представлено сочетание двух признаков в связи друг с другом

В) Комби­национные – дается распределение материала по трем и более взаимосвязанным признакам

При составлении таблиц должны соблюдаться определенные требо­вания :

– каждая таблица должна иметь заголовок, отражающий ее содержание;

– внутри таблицы все графы также должны иметь четкие краткие наз­вания;

– при заполнении таблицы все клетки таблицы должны содержать соответствующие числовые данные. Оставшиеся незаполненными из-за отсутствия данной комбинации клетки таблицы прочеркивают­ся ("-"), а при отсутствии сведений в клетке проставляется "н. с." или "…";

– после заполнения таблицы в нижней горизонтальном ряду и в пос­леднем справа вертикальном столбце подводятся итоги верти­кальных граф и горизонтальных строк.

– таблицы должны иметь единую последовательную нумерацию.

В исследованиях, имеющих небольшой объем наблюдений, сводка проводится вручную. Все учетные документы раскладываются на груп­пы в соответствии с шифром признака. Далее проводится подсчет и запись данных в соответствующую клетку таблицы. В настоящее время в проведении сортировки и сводки материала широко используются ЭВМ. Которые позволяют не только отсортиро­вать материал по изучаемым признакам, Но выполнить расчеты пока­зателей.

4 этап. Статистический анализ изучаемого явления, формулировка выводов – ответственный этап исследования, на котором проводится вычисление ста­тистических показателей (частоты, Структуры, Средних размеров изучаемого явления), дается их графическое изображение, Изучает­ся динамика, Тенденции, устанавливаются связи между явлениями. Даются прогнозы и т. д. Анализ предполагает интерпретацию получен­ных данных, оценку достоверности результатов исследования. В зак­лючение делаются выводы.

5 этап. Литературная обработка и оформление полученных результатов – является заключительным, предполагает окончательное оформление результатов статистичес­кого исследования. Результаты могут быть оформлены в виде статьи, отчета, доклада, Диссертации и др. Для каждого вида оформления существуют определенные требования, Которые должны соблюдаться при литературной обработке результатов статистического исследования.

Результаты медико-статистического исследования внедряются в практику здравоохранения. Возможны различные варианты использова­ния результатов исследования: ознакомление с результатами широ­кой аудитории медицинских и научных работников; подготовка ин­структивно-методических документов; оформление рационализаторско­го предложения и другие

По завершении статистического исследования разрабатываются ре­комендации и управленческие решения, проводится внедрение ре­зультатов исследования в практику, оценивается эффективность.

В проведении статистического исследования важнейшим элементом является соблюдение строгой последовательности в осуществлении названных этапов.

2.1 Схема проведения статистического исследования

Системы статистического анализа данных – это современный эффективный инструмент статистического исследования. Широкие возможности для обработки статистических данных имеют специальные системы статистического анализа, а также универсальные средства – Excel, Matlab, Mathcad и др..

Но даже самый совершенный инструмент не может заменить исследователя, который должен сформулировать цель исследования, провести сбор данных, выбрать методы, подходы, модели и средства проведения обработки и анализа данных, а также интерпретировать полученные результаты.

На рисунке 2.1 представлена схема проведения статистического исследования.

Рис.2.1 - Принципиальная схема статистического исследования

Исходным пунктом статистического исследования является формулировка проблемы. При ее определении учитывается цель исследования, определяется, какая информация необходима и как она будет использоваться при принятии решения.

Само статистическое исследование начинается с подготовительного этапа. В ходе подготовительного этапа аналитики изучают техническое задание – документ, составляемый заказчиком исследования. В техническом задании должны быть четко сформулированы цели исследования:

    определен объект исследования;

    перечислены предположения и гипотезы, которые в ходе исследования должны быть подтверждены или опровергнуты;

    описано то, как будут использоваться результаты исследования;

    сроки, в которые исследование должно быть проведено и бюджет исследования.

На основе технического задания разрабатывается структура аналитического отчета - то, в каком виде должны быть представлены результаты исследования, а также программа статистического наблюдения . Программа представляет собой перечень признаков, подлежащих регистрации в процессе наблюдения (или вопросов на которые должны быть получены достоверные ответы по каждой обследуемой единице наблюдения). Содержание программы определяется как особенностями наблюдаемого объекта и целями исследования, так и методами, выбранными аналитиками для дальнейшей обработки собранной информации.

Основной этап статистического исследования включает сбор необходимых данных и их анализ.

Финальным этапом исследования является составление аналитического отчета и предоставление его заказчику.

На рис. 2.2 представлена схема статистического анализа данных.

Рис.2.2 – Основные этапы статистического анализа

2.2 Сбор статистической информации

Сбор материалов подразумевает анализ технического задания исследования, определение источников необходимой информации и (при необходимости) разработку анкет. При исследовании источников информации все требуемые данные разделяют на первичные (данные, которых нет в наличии и которые должны быть собраны непосредственно для данного исследования), и вторичные (собранные ранее для иных целей).

Сбор вторичных данных часто называют "кабинетным" или "библиотечным" исследованием.

Примеры сбора первичных данных: наблюдения за посетителями магазина, анкетирование пациентов больницы, обсуждение проблемы на совещании.

Вторичные данные делят на внутренние и внешние.

Примеры источников внутренних вторичных данных:

    информационная система организации (включающая в себя бухгалтерскую подсистему, подсистему управления продажами, CRM (CRM-система, сокращение от англ. Customer Relationship Management) - прикладное программное обеспечение для организаций, предназначенное для автоматизации стратегий взаимодействия с заказчиками) и другие);

    ранее проведенные исследования;

    письменные отчеты сотрудников.

Примеры источников внешних вторичных данных:

    отчеты органов статистики и других государственных учреждений;

    отчеты маркетинговых агентств, профессиональных ассоциаций и т.п.;

    электронные базы данных (адресные справочники, ГИС и т.п.);

    библиотеки;

    средства массовой информации.

Основными выходными данными на этапе сбора данных являются:

    планируемый объем выборки;

    структура выборки (наличие и размер квот);

    вид статистического наблюдения (сбор данных опрос, анкетирование, измерение, эксперимент, экспертиза, др.);

    информация о параметрах опроса (например, возможность факта фальсификации анкет);

    схема кодировки переменных в базе данных программы, выбранной для обработки;

    план-схема преобразования данных;

    план-схема используемых статистических процедур.

Этот же этап включает непосредственно процедуру анкетирования. Разумеется, анкеты разрабатываются только для получения первичной информации.

Полученные данные должны быть соответствующим образом отредактированы и подготовлены. Каждая анкета или форма наблюдения проверяется и, если нужно, корректируется. Каждому ответу присваиваются числовые или буквенные коды – производится кодировка информации. Подготовка данных включает в себя редактирование, расшифровку и проверку данных, их кодирование и необходимые преобразования.

2.3 Определение характеристик выборки

Как правило, данные, собранные в результате статистического наблюдения для проведения статистического анализа являются выборочной совокупностью. Последовательность преобразования данных в процесс статистического исследования можно схематично представить следующим образом (рис. 2.3)

Рис 2.3 Схема преобразования статистических данных

Анализируя выборку, можно делать выводы о генеральной совокупности, представленной выборкой.

Окончательное определение общих параметров выборки производят, когда все анкеты собраны. Оно включает:

    определение реального количества респондентов,

    определение структуры выборки,

    распределение по месту опроса,

    установление доверительного уровня статистической надежности выборки,

    расчет статистической ошибки и определение репрезентативности выборки.

Реальное количество респондентов может оказаться большим либо меньшим запланированного. Первый вариант лучше для анализа, но невыгоден заказчику исследования. Второй может отрицательно сказаться на качестве исследования, а, следовательно, невыгоден ни аналитикам, ни заказчикам.

Структура выборки может быть случайной или неслучайной (респонденты отбирались на основе заранее известного критерия, например методом квотирования). Случайные выборки априори являются репрезентативными. Неслучайные выборки могут быть намерено нерепрезентативными относительно генеральной совокупности, но давать важную информацию для исследований. В этом случае также следует внимательно отнестись к фильтрационным вопросам анкеты, которые предназначены специально для отсеивания неподходящих под требования респондентов.

Для определения точности оценивания , прежде всего, необходимо установить уровень доверительной вероятности (95% или 99%). Тогда максимальная статистическая ошибка выборки рассчитывается как

или
,

где - объем выборки,- вероятность наступления исследуемого события (попадание респондента в выборку),- вероятность обратного события (непопадания респондента в выборку),- коэффициент доверительной вероятности,
- дисперсия признака.

В таблице 2.4 приведены наиболее употребляемые значения доверительной вероятности и коэффициентов доверительной вероятности.

Таблица 2.4

2.5 Обработка данных на компьютере

Анализ данных с применением компьютера включает выполнение ряда необходимых шагов.

1. Определение структуры исходных данных.

2. Ввод данных в компьютер в соответствии с их структурой и требованиями программы. Редактирование и преобразование данных.

3. Задание метода обработки данных в соответствии с задачами исследования.

4. Получение результата обработки данных. Его редактирование и сохранение в нужном формате.

5. Интерпретация результата обработки.

Шаги 1 (подготовительный) и 5 (заключительный) не способна выполнить ни одна компьютерная программа - их исследователь делает сам. Шаги 2-4 выполняются исследователем с использованием программы, но именно исследователь определяет необходимые процедуры редактирования и преобразования данных, методы обработки данных, а также формат представления результатов обработки. Помощь компьютера (шаги 2–4) заключается, в конечном итоге, в переходе от длинной последовательности чисел к более компактной. На «вход» компьютера исследователь подает массив исходных данных, который недоступен осмыслению, но пригоден для компьютерной обработки (шаг 2). Затем исследователь дает программе команду на обработку данных в соответствии с поставленной задачей и структурой данных (шаг 3). На «выходе» он получает результат обработки (шаг 4) - тоже массив данных, только уже меньший, доступный осмыслению и содержательной интерпретации. При этом исчерпывающий анализ данных обычно требует многократной их обработки с применением разных методов.

2.6 Выбор стратегии анализа данных

Выбор стратегии анализа собранных данных основывается на знании теоретических и практических аспектов исследуемой предметной области, специфики и известных характеристик информации, свойств конкретных статистических методов, а также на опыте и взглядах исследователя.

Необходимо помнить, что анализ данных - это вовсе не конечная цель исследования. Его цель - получить информацию, которая поможет решить определенную проблему и принять адекватные управленческие решения. Выбор стратегии анализа должен начинаться с исследования итогов предыдущих этапов процесса: определение проблемы и разработка плана исследования. В качестве "черновика" используется предварительный план анализа данных, разработанный как один из элементов плана исследования. Затем, в ходе поступления на последующих стадиях процесса исследования дополнительной информации, может понадобиться внесение определенных изменений.

Статистические методы делятся на одно- и многомерные. Одномерные методы(univariatetechniques) используются тогда, когда все элементы выборки оцениваются одним показателем, либо если этих показателей несколько для каждого элемента, но каждая переменная анализируется при этом отдельно ото всех остальных.

Многомерные методы (multivariate techniques) прекрасно подходят для анализа данных, если для оценки каждого элемента выборки используется два или больше показателей и эти переменные анализируются одновременно. Такие методы применяются для определения зависимостей между явлениями.

Многомерные методы отличаются от одномерных прежде всего тем, что при их использовании центр внимания смещается с уровней (средних показателей) и распределений (дисперсий) явлений и сосредотачивается на степени взаимосвязи (корреляции или ковариации) между этими явлениями.

Одномерные методы можно классифицировать на основе того, какие данные анализируются: метрические или неметрические (рис. 3). Метрические данные (metric data) измеряются по интервальной шкале или относительной шкале. Неметрические данные (nonmetric data) оцениваются по номинальной или порядковой шкале

Кроме того, эти методы делят на классы на основе того, сколько выборок - одна, две или более - анализируется в ходе исследований.

Классификация одномерных статистических методов представлена на рис.2.4.

Рис. 2.4 Классификация одномерных статистических методов в зависимости от анализируемых данных

Число выборок определяется тем, как ведется работа с данными для конкретного анализа, а не тем, каким способом собирались данные. Например, данные по лицам мужского и женского пола можно получить в пределах одной выборки, но если их анализ нацелен на выявление разницы в восприятии, основанной на разнице полов, исследователю придется оперировать двумя разными выборками. Выборки считаются независимыми, если они экспериментально не связаны между собой. Измерения, проведенные в одной выборке, не оказывают влияния на значения переменных в другой. Для анализа данные, относящиеся к разным группам респондентов, например собранные от лиц женского и мужского пола, обычно обрабатываются как независимые выборки.

С другой стороны, если данные по двум выборкам относятся к одной и той же группе респондентов, выборки считаются объединенными в пары - зависимыми.

Если существует только одна выборка метрических данных, может использоваться z- и t-критерий. Если же независимых выборок две или больше, в первом случае можно воспользоваться z- и t-критерием для двух выборок, в во втором - методом однофакторного дисперсионного анализа. Для двух связанных выборок используется парный t-критерий. Если речь идет о неметрических данных по одной выборке, исследователь может воспользоваться критериями частотного распределения, хи-квадратом, критерием Колмогорова-Смирнова (K~S), критерием серий и биномиальным критерием. Для двух независимых выборок с неметрическими данными можно прибегнуть к следующим методам анализа: хи-квадрат, Манна-Уитни, медианы, К-С, однофакторным дисперсионным анализом Крускала-Уоллиса (ДА К-У). В отличие от этого, если существует две или больше взаимосвязанных выборок, следует воспользоваться критериями знаков, Мак-Немара и Уилкоксона.

Многомерные статистические методы нацелены на выявление существующих закономерностей: взаимозависимости переменных, взаимосвязи или последовательности событий, межобъектного сходства.

Достаточно условно можно выделить пять стандартных типов закономерностей, исследование которых представляет существенный интерес: ассоциация, последовательность, классификация, кластеризация и прогнозирование

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 65% купивших кукурузные чипсы берут также и "кока-колу", а при наличии скидки за такой комплект "колу" приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил.

Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации выделяют различные однородные группы данных.

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в виде временных рядов. Если удается построить найти закономерности, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем.

Многомерные статистические методы можно разделить на методы анализа взаимосвязи и классификационный анализ (рис. 2.5).

Рис.2.5 – Классификация многомерных статистических методов