Структурная группировка данных. Задачи и виды группировок


Сведения о каждой единице анализируемой совокупности, полученные в результате первой стадии статистического исследования, характеризуют статистическое наблюдение с различных его сторон, так как они обладают многочисленными признаками и свойствами, которые изменяются во времени и пространстве. Для получения сводной характеристики всего объекта при помощи обобщающих показателей нужно систематизировать и обобщить результаты, которые были получены в ходе статистического наблюдения. Это даст нам возможность выявить особенности и черты статистической совокупности в целом и отдельных ее составляющих, обнаружить закономерности изучаемых социально–экономических явлений и процессов. Данную систематизацию называют сводкой первичного статистического материала.

Второй этап статистической работы – статистическая сводка – это обработка первичных данных в целях получения обобщенных характеристик изучаемого явления или процесса по ряду существенных для него признаков для выявления типичных черт и закономерностей, присущих явлению или процессу в целом.

Статистическая сводка – это переход от единичных данных к сведениям о группах единиц и совокупности в целом.

Проведение сводки включает три этапа:

1) предварительный контроль – это проверка данных;

2) группировка данных по заданным признакам – это определение производных показателей;

3) оформление результатов сводки в виде статистических таблиц, они являются удобной формой для восприятия полученной информации.

Смысловая согласованность статистических сведений – это предварительный контроль. В соответствии с программой статистической сводки для того, чтобы в дальнейшем предоставить полученную информацию в доступном для восприятия виде, используется статистическая группировка данных.

Полученные результаты группировки оформляются в виде группировочных таблиц, содержащих сводную характеристику исследуемой совокупности по одному или нескольким признакам, которые взаимосвязаны логикой анализа. Различают сводку простую и сложную. Сведения об отдельных единицах подытоживаются в целом по совокупности без разделения их на однородные группы. Итоги простой статистической сводки предназначаются для дальнейшей обработки материала, простая сводка также имеет самостоятельное познавательное значение.

Простая статистическая сводка – это операция по подсчету общих итоговых и групповых данных по совокупности единиц наблюдения и оформление этого материала в таблицах.

Простая статистическая сводка дает нам возможность определить число единиц изучаемой совокупности и объем изучаемых признаков, но тем самым простая сводка не дает нам представления о целостности состава изучаемой совокупности.

Если единицы совокупности разбивают на однородные группы, после этого подсчитывают итоги по каждой группе, а затем по всей совокупности в целом, такую статистическую сводку называют сложной. Сложная сводка позволяет нам изучить состав совокупности и выявить влияние одних признаков на другие, т. е раскрыть свойственные данной совокупности закономерности.

Сложная статистическая сводка – это комплекс операций. включающих распределение единиц наблюдения изучаемого социально–экономического явления или процесса на группы, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов в каждой группе и подгруппах и оформление результатов этой работы в виде статистических таблиц. На основе всестороннего теоретического анализа сущности и содержания изучаемых явлений и процессов проводится статистическая сводка. Программой и планом проведения статистической сводки обеспечивается достоверность и обоснованность ее результатов.

Программа статистической сводки содержит перечень групп на которые может быть разбита или разбивается совокупность единиц статистического наблюдения, а также систему показателей, характеризующих изучаемую совокупность явлений и процессов как в целом, так и отдельных ее частей. От целей и задач исследования зависит программа статистической сводки. Разработка программы включает следующие этапы:

1) выбирается группировочный признак для образования однородных групп;

2) определяется порядок формирования и число групп;

3) разрабатывается система статистических показателей для характеристики групп и объекта в целом;

4) создаются макеты статистических таблиц для предоставления результатов сводки.

Вместе с программой статистической сводки составляют план ее проведения. План должен содержать информацию о последовательности, сроках и технике проведения сводки, ее исполнителях, о порядке и правилах оформления ее результатов в виде таблиц.

Сводка также бывает децентрализованной и централизованной.

Децентрализованная статистическая сводка – это способ обобщения материала, который осуществляется снизу доверху по иерархической лестнице управления и на каждом из этапов подвергается обработке. Обработка данных производится на местах, т. е. отчеты предприятий сводятся статистическими органами субъектов Российской Федерации. Полученные итоги поступают в Госкомстат РФ, а затем выводятся итоговые показатели в целом по социально–экономическому положению страны.

Централизованная статистическая сводка – это способ, при котором все первичные данные, полученные в результате статистического наблюдения, сосредоточиваются в одной центральной организации и подвергаются обработке от начала до конца.

По технике выполнения статистическая сводка бывает механизированная (с использованием электронно–вычислительной техники) и ручная.

2. Сущность и классификация группировок

Научно обоснованное распределение на группы дает возможность сделать правильные выводы об изучаемой совокупности и происходящих в ней процессах.

Принципы научной группировки были изложены в работах В. И. Ленина. Статистическая группировка, как указывал В. И. Ленин, не является второстепенным вопросом. Она требует всестороннего социально–экономического анализа изучаемых явлений, Решающее значение в статистической группировке имеет правильный выбор группировочных признаков в соответствии с задачами статистического исследования. В основу группировки должны быть положены самые существенные, самые важные для изучаемого вопроса признаки, которые позволят выявить социально–экономические типы явлений. Блестящим примером применения статистических группировок для выявления социально–экономических типов может служить таблица из работы В. И. Ленина «Развитие капитализма в России».

Статистическая группировка – это один из основных этапов проведения статистического исследования.

Процесс образования однородных групп на основе разделения статистической совокупности на части или объединение изучаемых статистических единиц в совокупности по определенным для них признакам называют статистической группировкой Важнейшим статистическим методом обобщения данных являются статистические группировки.

Три основных типа задач, решаемых с помощью метода статистической группировки:

1) выделение социально–экономических типов явлений;

2) изучение структуры явления и структурных сдвигов, происходящих в явлении;

3) выявление взаимосвязей и взаимозависимостей между явлениями и признаками, характеризующими эти явления. Различают следующие виды статистических группировок:

1) типологические;

2) структурные;

3) аналитические.

Качественно однородные группы совокупностей, т. е. объекты, которые по своим группировочным признакам близки друг к другу, называют типологической группировкой.

Примером типологической группировки являются: группировка земель, по формам собственности. Основное внимание в типологической группировке должно уделяться идентификации типов и выбору группировочного признака. Для построения типологической группировки необходимо воспользоваться количественными и качественными (атрибутивными) признаками.

Группировка по атрибутивному признаку предполагает, что число выделенных групп соответствует фактическому числу градаций этого признака. По количественному признаку необходимо правильно установить интервал группировки, определить необходимое число групп. Проблема определения интервалов типологической группировки решается на основании выделения таких количественных границ изменения группировочного признака, при которых явление изменяет или приобретает новое качество.

В типологической группировке от числа существующих социально–экономических типов зависит число групп. От состава, структуры однородных групп и изучения вариации признаков внутри однотипной совокупности и однотипных групп на основе построения структурной группировки зависят социально–экономические типы явлений. Разделение однородной совокупности на определенные группы, которые в дальнейшем будут характеризовать структуру по определенному группировочному признаку, называют структурной группировкой. Здесь также рассматриваются количественные и атрибутивные признаки. Примером является группировка рабочих склада по квалификации.

По атрибутивному признаку группы отличаются друг от друга по характеру признака. Количественный признак также предполагает определение числа групп и ширины интервала.

Основная задача статистических группировок – исследование связей и зависимостей между признаками единиц статистической совокупности, которая решается с помощью построения аналитических группировок. Аналитическая группировка – это группировка, выявляющая взаимосвязи и взаимозависимости между изучаемыми социально–экономическими явлениями и признаками, их характеризующими.

Все признаки в статистической науке можно подразделять на факторные и результативные. Признаки, которые оказывают большое влияние на изменение результативных признаков, называют факторными. Признаки, изменяющиеся под влиянием факторных признаков, называют результативными.

Важная задача при построении аналитической группировки – выбор числа групп, на которые необходимо разбить изучаемую совокупность единиц наблюдения, и определение их границ.

Требования, которые необходимо соблюдать в процессе построения аналитических группировок, это: каждая изучаемая группа должна содержать однородные единицы совокупности по груп–пировочному признаку, и количество единиц в каждой изучаемой группе должно быть достаточным для того, чтобы получить статистические характеристики изучаемого объекта.

Простой называется группировка, если группа образована только по одному признаку. Если разбить группу на подгруппу в соответствии с определенными признаками, то такую группировку называют комбинированной.

Комбинационной считается группировка, когда разбивка совокупности на группы производится по двум и более группировоч–ным признакам, взятым в сочетании (комбинации) друг с другом Комбинационные группировки позволяют изучать единицы совокупности одновременно по нескольким признакам.

При изучении сложных социально–экономических явлений и процессов применяются комбинационные группировки. Для того чтобы построить комбинационную группировку, необходимо выявить наличие достаточно большого числа наблюдений.

Для того чтобы найти скопление (в мерном пространстве) объектов (точек), необходимо применить многомерную группировку Различают группировки по используемой информации:

1) первичные – производятся на основе исходных данных которые были получены в результате статистического наблюдения;

2) вторичные – это результат соединения или расчленения группировки.

3. Принципы построения группировок

Для построения статистических группировок нужно выбрать группировочный признак, далее определить количество групп, на которые разбивают изучаемую статистическую совокупность и зафиксировать границы интервалов группировки. Для каждой группировки нужно находить конкретные показатели или их систему, которые должны охарактеризовать изучаемые группы.

Выбор группировочного признака – сложный вопрос в теории статистической группировки и статистического исследования в целом. Группировочный признак – это основание, по которому проводится разбивка единиц совокупности на отдельные группы. От степени точности группировочного признака зависит правильность выводов статистического исследования.

В группировку входят количественные и атрибутивные (качественные) признаки. Количественные признаки обычно имеют числовое выражение (например, объем выпускаемой продукции, возраст человека, доход семьи и т. д.). Атрибутивные признаки дают качественную характеристику единицы совокупности (например, пол, семейное положение, политическая ориентация человека и т. д.). Выделенные группы по атрибутивному признаку в группировке должны отличаться друг от друга по качественной характеристике признака. Число групп, на которые расчленяется статистическая совокупность, зависит от количества градаций атрибутивного признака.

Важно изучить экономическую сущность исследуемого явления при построении группировки по количественному признаку.

Для определения числа групп можно воспользоваться формулой Стерджесса:

h + 3,322 ? lg N,

где h – число групп;

N – число единиц совокупности;

lgN – десятичный логарифм от N.

Данная формула говорит о том, что выбор числа групп объектно зависит от объема совокупности. После установления числа групп решается вопрос об определении интервалов группировки.

На основе интервала группировки можно количественно различить одни группы от других и наметить границы выделения их нового качества. Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определенной группы. Каждый интервал имеет свою длину (ширину), верхнюю и нижнюю границы.

Нижняя граница интервала – это наименьшее значение признака в интервале, а верхняя граница интервала – его наибольшее значение. За нижнюю границу первого интервала принимают наименьшее значение признака в совокупности единиц наблюдения. Верхняя граница последнего интервала не может быть меньше наибольшего значения признака в совокупности единиц наблюдения.

Ширина интервала – это разность между верхней и нижней границами. Интервалы группировки в зависимости от их ширины бывают равными и неравными. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.

Величина равного интервала определяется по следующей формуле:

h = R/n = (х мах – х min) / n,

гдех мах,х min – максимальное и минимальное значение признака в совокупности;

n – число групп.

Данную формулу называют шагом интервала. Если размах вариации признака в совокупности велик и значения признака варьируются неравномерно, то используют группировку с неравными интервалами. Неравные интервалы могут быть получены, если построенная группировка с равными интервалами содержит группы, не отражающие определенные типы изучаемого явления или процесса или не содержащие ни одной единицы совокупности, возникает необходимость увеличения – объединения двух или нескольких малочисленных или «пустых» последовательных равных интервалов. Выбор равных или неравных интервалов зависит от степени заполнения интервалов. Интервалы группировок могут быть закрытыми и открытыми Закрытыми интервалами являются интервалы, в которых указаны верхняя и нижняя границы. Открытые интервалы имеют только одну границу (верхнюю – у первого, нижнюю – у последнего). К количественным признакам можно отнести непрерывный признак, или дискретный. Если в основании группировки лежит дискретный признак, то нижняя граница i – го интервала равна верхней границе i – го интервала, увеличенной на 1.

В группировках, отражающих качественные особенности и специфику выделяемых групп единиц изучаемой совокупности по определенному признаку, применяются специализированные интервалы. Специализированные интервалы – это интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку у явлений, находящихся в различных условиях. По роли, которую играют признаки во взаимосвязи изучаемых объектов, процессов или явлений, их можно подразделить на факторные и результативные. Факторные признаки воздействуют на другие признаки, а результативные испытывают на себе влияние других признаков.

Статистическая группировка – это разделение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.

Задачи, решаемые с помощью метода группировок:

Выделение социально-экономических типов явлений;

Изучение структуры явления и структурных сдвигов, происходящих в нем;

Выявление связи и зависимости между явлениями;

В соответствии с этими задачами различают следующие виды группировок:

1. Типологическая - расчленение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений;

2. Структурная - группировка, которая предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку или нескольким признакам

3. Аналитическая - группировка, выявляющая взаимосвязи между изучаемыми признаками.

Особенностями аналитической группировки является:

а) единицы группируются по факторному признаку;

б) каждая группа характеризуется средними величинами результативного признака.

Примеры видов группировок:

1. Типологические

Таблица 1

Распределение пенсионеров РФ по видам пенсионного обеспечения (на конец года, тыс. чел.)

    Структурные

Таблица 2

Распределение населения РФ по величине среднедушевых денежных доходов (в процентах)

Все население

в том числе со среднедушевыми денежными доходами, руб. в месяц:

1500,1 – 2000,0

2000,1 – 3000,0

3000,1 – 4000,0

4000,1 – 5000,0

5000,1 – 7000,0

7000,1 – 12000,0

Свыше 12000,1

    Аналитические

Таблица 3

Распределение региона по численности занятых в экономике (данные условные)

№ группы

Группы регионов по численности занятых в экономике, тыс.чел.

Число регионов

Численность занятых в экономике, тыс. чел.

Валовой региональный продукт, млрд. руб.

в среднем на один регион

в среднем на один регион

Разновидностью типологической группировки является классификация.

Под классификацией в статистике понимается группировка явлений, каких-либо объектов по относительно однообразным и устойчивым признакам (например, классификация экономики по секторам). Классификации используются в качестве национальных и международных стандартов в определенный промежуток времени.

Построение группировки начинается с определения группировочного признака (основания группировки) .

Группировочный признак – это расчленение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.

Группировочный признак (основание группировки) делится на:

    Количественный - число групп зависит от степени вариации группировочного признака: чем она больше, тем больше можно образовать групп;

    Атрибутивный - число групп определяется числом градаций атрибутивного признака (например, группировка населения по полу предполагает только две группы).

Если в основание группировки положен один признак, то группировка называется простой , если несколько, то – сложной (комбинационная и многомерная).

Комбинационные группировки строятся путем разбиения группы на подгруппы в соответствии с дополнительными признаками.

Многомерные группировки формируются с помощью специальных алгоритмов, когда определяются скопления в N-мерном пространстве, где каждый объект – точка.

После того, как определено основание группировки, решается вопрос о количестве групп , на которые необходимо разбить изучаемую совокупность.

Число групп зависит от:

Задач исследования;

Группировочного признака;

Объёма совокупности;

Степени вариации группировочного признака.

Если основанием группировки служит количественный признак, то для определения количества групп (группировка с равными интервалами) можно воспользоваться формулой американского ученого Стерджесса .

Формула Стерджесса:

n =1+3,322 lgN

n – число групп;

N – число единиц совокупности.

Когда определено число групп, то следует установить интервалы группировки.

Интервал группировки – это значения варьирующего признака, лежащие в определенных границах.

Интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижняя граница интервала – это минимальное значение признака, верхняя граница – наибольшее значение признака в интервале.

Величина интервала (ширина) представляет собой разность между верхней и нижней границами интервала.

Виды интервалов группировки бывают:

    Равный - применяется в тех случаях, когда вариация признака происходит в сравнительно узких границах и носит более или менее равномерный характер (таблица 3.3);

    Неравный - применяется в тех случаях, когда размах вариации признака в совокупности велик и значения признака варьируют неравномерно. Неравные интервалы делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные (таблица 3.2)

    Открытый - это интервал, у которого указана только одна граница: верхняя - у первого, нижняя – у последнего (таблица 3.2)

    Закрытый - это интервал, у которого имеются верхняя и нижняя границы (таблица 3.3)

При равных интервалах расчет величины интервала определяется по формуле:

h =(X max - X min )/ n (2)

где X max , X min - максимальное и минимальное значения признака в совокупности соответственно.

При определении величины интервала группировки следует учитывать следующие правила:

    если величина интервала, рассчитанная по формуле (2), имеет один знак до запятой (например, 0,7; 0,58; 2,359), то полученное значение следует округлить до десятых (в приведенном примере это будут значения: 0,7; 0,6; 2,4);

    если величина интервала, рассчитанная по формуле (2), имеет две значащие цифры до запятой и несколько после запятой (например, 11,2; 23,385), то это значение следует округлить до целого числа (в указанном примере это будут значения: 11; 23);

    если величина интервала, рассчитанная по формуле (2), представляет собой трехзначное число (например, 123; 757), то это значение целесообразно округлить до ближайшего число, кратного 10 (в приведенном примере это будут значения: 120; 760);

    если интервалы групп закрытые и основанием группировки служит непрерывный признак, то нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно» (например, если нижняя граница i - группы равна 50, а верхняя – 100, то единица совокупности со значением признака равным 100, попадет в группу i+1) (пример 3);

    если значение признака совпадает с границами интервалов, то можно использовать открытые интервалы, введя слова «до», «менее» и «более» (таблица 3.2);

    если в основании группировки лежит дискретный признак, то верхняя граница i-го интервала равна нижней границе i+1-го интервала, увеличенной на 1.

Группировкой называется разбиение общей совокупности единиц объекта наблю-дения по одному или нескольким существенным признакам на однородные группы, раз-личающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализи-ровать связи между отдельными признаками. Группировки являются важнейшим стати-стическим методом обобщения статистических данных, основой для правильного исчис-ления статистических показателей.

С помощью метода группировок решаются следующие задачи:

Выделение социально-экономических типов явлений;

Изучение структуры явления и структурных сдвигов, происходящих в нем;

Выявление взаимосвязи и взаимозависимости между явлениями.

В соответствии с познавательными задачами, решаемыми в ходе построения стати-стических группировок, различают следующие их виды: типологические, структурные, аналитические.

Типологическая группировка - это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида ос-новное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого социально-экономического явления.

Структурной называется группировка, которая предназначена для изучения соста-ва однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.

Группировка, выявляющая взаимосвязи между изучаемыми явлениями и призна-ками, их характеризующими, называется аналитической группировкой.

В статистике при изучении связей социально-экономических явлений признаки не-обходимо делить на факторные и результативные.

Факторными называются признаки, под воздействием которых изменяются дру-гие результативные признаки. Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака систематически возрастает или убывает значе-ние признака результативного и наоборот.

Особенностями построения аналитической группировки являются:

Единицы статистической совокупности группируются по факторному признаку;

Каждая выделенная группа характеризуется средними величинами результативного признака.

По способу построения группировки бывают простые и комбинационные.

Простой называется группировка, в которой группы образованы только по одному признаку.

Комбинационной называется группировка, в которой разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).


Сначала группы формируются по одному признаку, затем группы делятся на под-группы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупно-сти одновременно по нескольким взаимосвязанным признакам.

При построении комбинационной группировки возникает вопрос о последователь-ности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала про-изводить группировку по атрибутивным признакам, значения которых имеют ярко выра-женные качественные различия.

Принципы построения статистических группировок и классификаций.

Построение статистических группировок осуществляется по следующим этапам:

1. Определение группировочного признака.

2. Определение числа групп.

3. Расчет ширины интервала группировки.

4. Определение признаков, которые в комбинации друг с другом будут характери-зовать каждую выделенную группу.

Построение группировки начинается с определения группировочного признака.

Группировочным признаком называется признак, по которому проводится раз-биение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания груп-пировки необходимо использовать существенные, теоретически обоснованные признаки.

В основание группировки могут быть положены как количественные, так и качест-венные признаки. Количественные признаки - это признаки, которые имеют числовое выражение (объем выпускаемой продукции, возраст человека, доход сотрудника фирмы и т. д.). Качественные признаки отражают состояние единицы совокупности (пол, отрас-левая принадлежность предприятия, форма собственности фирмы и т.д.).

После того, как определено основание группировки, следует решить вопрос о количе-стве групп, на которые необходимо разбить исследуемую совокупность единиц наблюдения.

Число групп зависит от задач исследования и вида показателя, положенного в ос-нование группировки, объема изучаемой совокупности и степени вариации признака. Вид показателя особенно существенен при анализе качественных признаков. Так, например, группировка сотрудников фирмы по полу учитывает только две градации: «мужской» и «женский».

В случае группировки единиц наблюдения по количественному признаку особое внимание необходимо обратить на число единиц исследуемого объекта, объем совокупно-сти и степень колеблемости группировочного признака.

При небольшом объеме совокупности (n<50) не следует образовывать большого количества групп, так как группы будут включать недостаточное число единиц объекта. Показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.

Часто группировка по количественному признаку имеет задачу отразить распреде-ление единиц совокупности по этому признаку. В этом случае количество групп зависит, в первую очередь, от степени колеблемости группировочного признака: чем больше его ко-леблемость, тем больше можно образовать групп. Поэтому при определении числа групп необходимо принять во внимание размах вариации признака (R), который позволяет оце-нить вариацию признака между крайними значениями признака - максимальным (Хmах) и минимальным (Xmin) и определяется по следующей формуле:

R = Хmах - Xmin

Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано большее число групп. При этом может возникнуть проблема получения пустых групп, т.е. групп, не содержащих ни одной единицы на-блюдения.

Построение большого числа групп позволит, с одной стороны, точнее воспроизве-сти характер исследуемого объекта. Однако, с другой стороны, слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономиче-ских явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но и из особенно-стей объекта и показателей, его характеризующих, а также цели исследования.

Определение числа групп можно осуществить несколькими способами. Формаль-но-математический способ предполагает использование формулы Стерджесса :
n = 1 + 3,322 × lgN, (3.1)

n - число групп;

N - число единиц совокупности.

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Применение данной формулы дает хорошие результаты в том случае, если сово-купность состоит из большого числа единиц наблюдения (n>50).

Другой способ определения числа групп основан на применении показателя сред-него квадратического отклонения (σ). Если величина интервала равна 0,5σ, то совокуп-ность разбивается на 12 групп, а когда величина интервала равна 2/З σ и σ, то совокуп-ность делится, собственно, на 9 и 6 групп. Однако при определении групп данными мето-дами существует большая вероятность получения «пустых» или малочисленных групп, характеристики изучаемого явления на основе которых будут недостаточно типичными для выделенной группы и изучаемой совокупности в целом.

Когда определено число групп, то следует определить интервалы группировки.

Интервал - это значения варьирующего признака, лежащие в определенных гра-ницах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки бывают:

Равные и неравные;

Открытые и закрытые.

В зависимости от величины интервалы группировки бывают: равные и неравные. В свою очередь, неравные интервалы подразделяются на прогрессивно возрастающие, про-грессивно убывающие, произвольные и специализированные.

Равные интервалы применяются в случае, если изменение количественного при-знака внутри изучаемой совокупности единиц наблюдения происходит равномерно и его вариация проявляется в сравнительно узких границах.

Ширина равного интервала определяется по следующей формуле:

h = R/n = Xmax - Xmin/n (3.2)

Xmax, Xmin - максимальное и минимальное значения признака в совокупности;

n - число групп.

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или мини-мальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (3.2) величину округляют и она будет являться шириной интервала.

Существуют следующие правила определения ширины интервала.

Если величина интервала, рассчитанная по формуле (3.2) представляет собой вели-чину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.

Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например 14,876), то это значение необходимо округлить до це-лого числа (до 15).

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.

Если размах вариации признака в совокупности велик и значения признака варьи-руют неравномерно, то надо использовать группировку с неравными интервалами. Нерав-ные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если по-сле построения равных интервалов по изучаемому признаку образуются группы, содер-жащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необхо-димость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно-возрастающие или прогрес-сивно-убывающие в арифметической или геометрической прогрессии. Величина интерва-лов, изменяющихся в арифметической и геометрической прогрессии, определяется сле-дующим образом:

h i+1 = h i + a,

а в геометрической прогрессии:

h i+1 = h i x q,

а - константа: для прогрессивно-возрастающих интервалов имеет знак «+», а при прогрессивно-убывающих - знак «-».

q - константа: для прогрессивно-возрастающих - больше «1»; для прогрессивно-убывающих - меньше «1».

Применение неравных интервалов обусловлено тем, что в первых группах неболь-шая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки строительных компаний города по показа-телю численности работающих, который варьирует от 500 человек до 3500 человек, неце-лесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и круп-нейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500-1000, 1000-2000, 2000-3500, т. е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии.

Выбор ис-следователя в построении равных или неравных интервалов зависит от степени заполне-ния каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала су-щественна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае - объединять.

Интервалы группировок могут быть закрытыми и открытыми.

Закрытыми называются интервалы, у которых имеются обе границы: верхняя и нижняя границы.

Открытые - это интервалы, у которых указана только одна граница: как правило, верхняя - у первого интервала и нижняя - у последнего. Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50-100, 100-150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупно-сти встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех ос-тальных значений изучаемого признака.

При группировке единиц совокупности по количественному признаку границы ин-тервалов могут быть обозначены по-разному, в зависимости от того, непрерывный или дискретный признак положен в основание группировки.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственны-ми силами (тыс. руб.): 1200-1400, 1400-1600, 1600-1800, 1800-2000), то одно ито же зна-чение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. - соответственно второго и третьего и т.д., т.е. верхняя граница i - го интервала равна нижней границе (i+1) - го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу вклю-чать единицы наблюдения, значения признака у которых совпадают с границами интерва-лов. Например, во вторую или третью группу должна войти строительная фирма с объе-мом строительно-монтажных работ 1600 тыс. рублей? Если верхняя граница формируется по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в про-тивном случае - ко второй.

Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строитель-ных фирм по объему строительно-монтажных работ преобразуются в следующие: до 1400, 1400-1600, 1600-1800, 1800 и более). В данном случае, вопрос отнесения отдельных еди-ниц совокупности, значения которых являются граничными, к той или иной группе реша-ется на основе анализа последнего открытого интервала.

Возможны два случая обозначе-ния последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае, строительные фирмы с объемом строительно-монтажных работ 1600 тыс. руб. попадут в третью группу; во втором случае - во вторую группу.

Если в основании группировки лежит дискретный признак, то нижняя граница i-ro интервала равна верхней границе i-1-го интервала, увеличенной на 1. Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100-150, 151-200, 201-300.

При определении границ интервалов статистических группировок иногда исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому.

Строя такую группировку, следует дифференцированно устанавливать границы ин-тервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами.

Специализированные интерва-лы - это такие интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных усло-виях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрес-сивно-убывающими. Такие интервалы называются произвольнымии , как правило, ис-пользуются при группировке предприятий, например, по уровню рентабельности.

Основой статистической группировки является группиро- вочный признак - признак, по которому происходит разделение единиц совокупности на отдельные группы. От выбора группировочного признака полностью зависит правильность построения всей группировки. В качестве основания группировки необходимо использовать наиболее существенные признаки, имеющие четкое теоретическое обоснование. Группировочный признак должен в полной мере передавать специфику исследуемых социально-экономических явлений и процессов (рис. 3.2).

Рис. 3.2.

Основанием группировки могут служить две различные по форме выражения группы признаков - атрибутивные и количественные. Первые передают качественное состояние единицы наблюдения, вторые - количественное, числовое. Например, группировка населения по национальности является атрибутивной, по возрасту - количественной.

Статистическая группировка может быть разделена на виды но ряду характерных признаков: решаемые задачи, число группировочных признаков и отношения между ними, состояние исходных данных (рис. 3.3).


По решаемым задачам группировки делятся на типологические, структурные и аналитические. Особым видом является ряд распределения.

Типологическая группировка - это вид статистической группировки, в процессе которой происходит разделение разнородной совокупности на однородные группы с целью выявления типов социально-экономических явлений и процессов. Типологические группировки позволяют детально изучить процесс развития искомого явления или процесса, оценить силу воздействия различных факторов на изменения в его состоянии. К примеру, все население может быть разделено на возрастные группы: дети, молодежь, лица зрелого возраста, пожилые люди и т.п. Однако конкретные числовые характеристики, определяющие рамки каждой группы, со временем нередко меняются, создавая возможность принадлежности одной единицы наблюдения к различным типам.

Структурная группировка - это вид статистической группировки, в процессе которой происходит разделение однородной совокупности на однородные группы с целью выявления структуры социально-экономических явлений и процессов. Например, структура населения может быть изучена но национальности и месту проживания, оценена по концентрации живущих на той или иной территории, а анализ группировки за ряд лет позволит охарактеризовать структурные сдвиги по исследуемому признаку.

Аналитическая группировка - это вид статистической группировки, выявляющей зависимости между взаимодействующими признаками.

Статистическая теория разделяет признаки по функциям, выполняемым во взаимосвязи, на факторные и результативные. Факторный признак - это признак, под воздействием которого меняется другой признак - результативный.

Основой такой группировки является признак-фактор, по результативному признаку подсчитывается его среднее значение в каждой из выделенных групп. Сравнение изменений значений обоих признаков характеризует связь между ними. Если с увеличением значения факторного признака увеличивается значение результативного, то говорят о прямой связи между признаками, в противном случае - об обратной.

При исследовании воздействия на результат нескольких факторов строится многофакторная группировка. Ее задача заключается в выделении профилирующего факторного признака, оказывающего наибольшее влияние на результат.

По числу группировочных признаков различают простую и сложную группировки. В основу простой группировки кладется один группировочный признак, в основу сложной - два признака и более. В свою очередь сложная группировка может быть комбинационной или многомерной. Основание комбинационной группировки составляют от двух до четырех группировочных признаков, многомерной - любое число признаков свыше четырех.

Сложная группировка обеспечивает возможность детального изучения единицы наблюдения сразу по нескольким признакам. Основным правилом построения всех сложных группировок является первичное разделение единиц совокупности на группы но одному признаку, затем - на подгруппы по другому признаку и т.д. Предпочтительно первичное разделение на группы по атрибутивным признакам, вторичное - по количественным. Необходимым условием построения сложной группировки является большое число наблюдений для достижения достаточного количества единиц в каждой из подгрупп. В противном случае присутствует риск получения малообоснованных результатов.

По отношению между признаками сложные группировки бывают иерархические и неиерархические. При иерархической группировке значения второго признака определяются областью значений первого. При неиерархической группировке значения второго признака не зависят от значений первого.

В процессе экономико-статистического исследования нередко возникает необходимость анализа и сравнения общественных явлений и процессов в конкретных территориальных границах. Для этого используется пространственная группировка - группировка, основанная на географическом признаке.

Группировка может быть построена по взаимоисключающему характеру признака, т.е. по признаку, которым одни единицы совокупности обладают, а другие - нет. В теории статистики такой признак называется альтернативным. Типичным примером является группировка населения по полу.

Сводка и группировка статистических данных

В результате первой стадии статистического исследования – статистического наблюдения – получают сведения о каждой единице совокупности. Задача второй стадии статистического исследования состоит в том, чтобы упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщающую характеристику совокупности. Этот этап в статистике называется сводкой и группировкой статистических данных .

Различают простую сводку (подсчет только общих итогов) и статистическую группировку (расчленение совокупности на группы по существенному для единиц совокупности признаку).

Группировка позволяет получить такие результаты, по которым можно выявить состав совокупности, характерные черты и свойства типичных явлений, обнаружить закономерности и взаимосвязи.

Результаты сводки и группировки могут быть представлены в виде статистических рядов распределения.

Статистическим рядом распределения называют упорядоченное распределение единиц совокупности на группы по изучаемому признаку. В зависимости от признака ряды могут быть вариационными (количественными) и атрибутивными (качественными).

Вариационные ряды могут быть дискретными или интервальными.

Дискретный ряд распределения - это ряд, в котором варианты выражены целым числом.

Примером может служить распределение рабочих по тарифным разрядам:

Интервальный ряд распределения - это ряд, в котором значения признака заданы в виде интервала. Например, распределение рабочих по разрядам можно представить в виде интервального ряда.

Статистические ряды распределения позволяют систематизировать и обобщать статистический материал, однако они не дают всесторонней характеристики выделенных групп. Чтобы решить ряд конкретных задач, выявить особенности в развитии явления, обнаружить тенденции, установить зависимости, необходимо произвести группировку статистических данных.

В зависимости от цели и задач исследования различают следующие виды группировок: типологические, структурные, аналитические, комбинированные.

К типологическим группировкам относят такие группировки, которые характеризуют качественные особенности и различия между типами явлений.

Типологические группировки широко применяются в экономических, социальных и других исследованиях. Приведем пример типологической группировки (табл. 1).

Таблица 1

Распределение промышленной продукции, произведенной на предприятиях различных форм собственности за отчетный период.

Структурная группировка - это группировка, выявляющая состав (строение, структуру) однородной в качественном отношении совокупности по какому-либо признаку. Примером могут служить группировки предприятий по проценту выполнения плана, по числу рабочих и т.д.

Значение структурных группировок заключается в том, что с их помощью могут быть выделены и изучены группы предприятий преуспевающих и отстающих; выявлены неиспользованные резервы производства, например, в области улучшения использования основных фондов, повышение производительности труда, улучшение качества продукции и т.д.

Группировка населения по возрасту, например, необходима для проведения различных расчетов, связанных с медицинским, культурным, бытовым обслуживанием населения, для вычисления специальных демографических показателей и т.д. Пример структурной группировки (табл. 2).

Таблица 2

Распределение рабочих, работающих на заводах с различной среднегодовой стоимостью ОПФ в отчетном году

Наибольшая численность рабочих приходится на группу заводов со среднегодовой стоимостью ОПФ от 2,2 до 3,4 млн. усл. ден. ед., т.е. со средней стоимостью ОПФ.

Аналитическая группировка - это группировка, которая применяется для исследования взаимосвязи между явлениями. Используя аналитические группировки, определяют факторные и результативные признаки изучаемых явлений.

Факторные - это признаки, оказывающие влияние на другие, связанные с ними признаки.

Результативные – это признаки, которые изменяются под влиянием факторных. Пример аналитической группировки (табл. 3).

Таблица 3

Распределение торговых площадей магазинов

с различными объемами товарооборота

Чем больше торговая площадь (факторный признак), тем выше объем товарооборота (результативный признак).

Комбинированные группировки – образование групп по двум и более признакам, взятым в определенном сочетании. При этом группировочные признаки принято располагать, начиная с атрибутивного, в определенной последовательности, исходя из логики взаимосвязи показателей.

Применение комбинированных группировок обусловлено многообразием экономических явлений, а также необходимостью их всестороннего изучения. Но увеличение числа группировочных признаков ограничивается уменьшением наглядности, что снижает эффективность использования статистической информации. Примером комбинированной группировки может служить разделение предприятий по формам собственности, далее на подгруппы по уровню рентабельности или по другим признакам (производительность труда, фондоотдача и т.д.).

Пример комбинированной группировки см. в теме «Статистические таблицы» (табл. 3).

Техника проведения группировки

1. Определяется группировочный признак или основание группировки.

Для группировки промышленных предприятиях отрасли в качестве группировочного признака можно выбрать:

    число рабочих на предприятии;

    число всех работающих;

    мощность энергоустановок;

    объем выпуска продукции;

    стоимость ОПФ и т.д.

Таким образом, по каждому из этих признаков, множество предприятий отрасли можно разбить на группы.

2. Определяется число интервалов группировки и их границы.

Интервалы группировки могут равные и неравные.

Равные интервалы используются, когда изменение признака внутри совокупности происходит равномерно, либо если далее планируется последующая математическая обработка сгруппированных данных.

Неравные интервалы обычно используются как прогрессивно увеличивающиеся. В экономической статистике чаще всего устанавливаются границы интервалов, основанные именно на таком принципе. Число групп в группировке выбирается в этом случае из таких предпосылок: изменчивость признака, число наблюдений, однородность групп.

Имеются данные о работе 24 предприятий одной из отраслей промышленности (табл. 4.).

Таблица 4

Номер п/п

Среднегодовая стоимость ОПФ, млн. усл. ден. ед.

Среднесписочное число работающих за отчетный период, чел.

Производство продукции за отчетный период, млн. усл. ден. ед.

Выполнение

Глядя на таблицу, трудно судить о характере распределения предприятий, например, по проценту выполнения плана, по числу работающих, по стоимости основных фондов. Трудно сказать, какие показатели наиболее характерны для предприятий данной отрасли промышленности. Поэтому имеющиеся данные надо привести в систему по интересующему нас признаку.

В качестве изучаемого признака возьмем стоимость основных производственных фондов и построим к нему ряд распределения с равными закрытыми интервалами. Величина интервала определяется по формуле:

где
,
- максимальное и минимальное значения изучаемого признака,

k - число групп.

,

где n – единиц совокупности.

х max = 7,0 млн. усл. ден. ед.;

х min = 1,0 млн. усл. ден. ед.;

k = 1+ 3,32 · lg 24 = 5,58 групп

Образуем пять групп предприятий. Тогда величина интервала равна будет равна:

i = (7,0 - 1,0) / 5 = 1,2 млн. усл. ден. ед.

Теперь образуем группы предприятий, которые отличаются друг от друга по среднегодовой стоимости основных фондов на эту величину (по табл. 4).

1,0 - 2,2 (1,0 + 1,2 = 2,2) 3

2,2 - 3,4 (2,2 + 1,2 = 3,4) 9

3,4 - 4,6 (3,4 + 1,2 = 4,6) 5

4,6 - 5,8 (4,6 + 1,2 = 5,8) 3

5,8 - 7,0 (5,8 + 1,2 = 7,0) 4

На основании этого составляем таблицу, в которой показываем распределение заводов по стоимости основных фондов и удельный вес предприятий группы в % к итогу.

Таблица 5

Группы заводов по стоимости ОПФ, млн. усл. ден. ед.

Число предприятий

Удельный вес предприятий группы в % к итогу

По данным таблицы видно, что для данной отрасли характерной является группа заводов со среднегодовой стоимостью основных фондов от 2,2 до 3,4 млн. усл. ден. ед., которая составляет 37,5 % всех предприятий, при этом более половины заводов (58,3 %) имеют стоимость основных фондов в размере от 2,2 до 4,6 млн. усл. ден. ед.

Выявим распределение предприятий данной отрасли промышленности по среднегодовой стоимости основных производственных фондов. Для этого составим рабочую таблицу.

Таблица 6

Группы предприятий по среднегодовой стоимости ОПФ, млн. усл. ден. ед.

Номер предприятия

Стоимость ОПФ, млн. усл. ден. ед.

Численность рабочих, чел.

Стоимость валовой продукции, млн. усл. ден. ед.

Итого по группе

Итого по группе

Итого по группе

Итого по группе

Итого по группе

Составим таблицу с системой показателей, куда занесем результаты группировки предприятий по среднегодовой стоимости основных производственных фондов (табл. 7).

Таблица 7

Группировка заводов по среднегодовой стоимости ОПФ

Группы предпр-й по среднегод. стоимости ОПФ, млн. усл. ден. ед.

Предприятия

Стоимость ОПФ

Численность рабочих

Стоимость валовой продукции

число пред.

в % к итогу

млн. усл. ден. ед.

в % к итогу

в % к итогу

млн. усл. ден. ед.

в % к итогу

Таким образом, в отличие от ряда распределения (табл. 5) группировка позволяет сделать конкретные и содержательные выводы. Данная группировка показывает, что наиболее крупные предприятия имеют лучшие производственные показатели: 29,2% предприятий (группы 4 и 5) имеют 45% всех основных фондов и дают 52% всего объема промышленной продукции, имея лишь 31,5% общего числа рабочих.

Приемы вторичной группировки

Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой.

К этому методу прибегают в двух случаях:

1) когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности.

В этом случае производят укрупнение или уменьшение интервалов.

2) для приведения к сопоставимому виду группировок с различными интервалами.

Рассмотрим приемы вторичной группировки на примерах.

Пример 1.

Произвести укрупнение интервалов на основе данных таблицы 8:

Таблица 8

Группы магазинов по размеру товарооборота за IV квартал,

тыс. усл. ден. ед.

Число магазинов

Товарооборот за IV квартал,

тыс. усл. ден. ед.

Выбор редакции
1.1 Отчет о движении продуктов и тары на производстве Акт о реализации и отпуске изделий кухни составляется ежед­невно на основании...

, Эксперт Службы Правового консалтинга компании "Гарант" Любой владелец участка – и не важно, каким образом тот ему достался и какое...

Индивидуальные предприниматели вправе выбрать общую систему налогообложения. Как правило, ОСНО выбирается, когда ИП нужно работать с НДС...

Теория и практика бухгалтерского учета исходит из принципа соответствия. Его суть сводится к фразе: «доходы должны соответствовать тем...
Развитие национальной экономики не является равномерным. Оно подвержено макроэкономической нестабильности , которая зависит от...
Приветствую вас, дорогие друзья! У меня для вас прекрасная новость – собственному жилью быть ! Да-да, вы не ослышались. В нашей стране...
Современные представления об особенностях экономической мысли средневековья (феодального общества) так же, как и времен Древнего мира,...
Продажа товаров оформляется в программе документом Реализация товаров и услуг. Документ можно провести, только если есть определенное...
Теория бухгалтерского учета. Шпаргалки Ольшевская Наталья 24. Классификация хозяйственных средств организацииСостав хозяйственных...