Интернет. Программы. Игры. Операционные системы. Антивирусы

Типы информационных массивов и единицы контент-анализа. Описание метода контент-анализ Единицами контент анализа могут быть

» Контент-анализ социология

© О.Т. Манаев

Контент-анализ - описание метода

Контент-анализ (от англ. contens содержание) - метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Не все документы могут стать объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Основные направления применения контент-анализа: выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта - окружающей действительности, автора или адресата); определение того, что существует только в тексте как таковом (различные характеристики формы - язык, структура, жанр сообщения, ритм и тон речи); выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа - наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике отечественного контент-анализа сложилась довольно устойчивая система категорий - знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа - лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. В практике отечественных контент-аналитических исследований наиболее, употребительными единицами анализа являются слово, простое предложение, суждение, тема, автор, герой, социальная ситуация, сообщение в целом и др. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа - контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица - «предложение». Наконец, необходимо установить единицу счета - количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаше всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации - 12-16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.

Необходимым условием является разработка таблицы контент-анализа - основного рабочего документа, с помощью которого проводится исследование. Тип таблицы определяется этапом исследования. Например разрабатывая категориальный аппарат, аналитик составляет таблицу, представляющую собой систему скоординированных и субординированных категорий анализа. Такая таблица внешне напоминает анкету: каждая категория (вопрос) предполагает ряд признаков (ответов), по которым квантифицируется содержание текста. Для регистрации единиц анализа составляется другая таблица - кодировальная матрица. Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с тетрадью таких матричных листов. Если выборка невелика (до 100 единиц), то можно проводить двумерный или многомерный анализ. В этом случае для каждого текста должна быть своя кодировальная матрица. Эта работа трудоемка и кропотлива, поэтому при больших объемах выборки сопоставление интересующих исследователя признаков осуществляется на компьютере.

Важным условием контент-анализа является разработка инструкции кодировщику - системы правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя) заданные единицы анализа. В инструкции точно и однозначно излагается алгоритм действий кодировщика, дается операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как следует поступать в спорных случаях, и т.д. Процедура подсчета при количественном контент-анализе в общем виде аналогична стандартным приемам классификации по выделенным группировкам ранжирования и измерения ассоциации. Существуют также специальные процедуры подсчета применительно к контент-анализу, напр., формула коэффициента Яниса, предназначенного для вычисления соотношения положительных и отрицательных (относительно избранной позиции) оценок, суждений, аргументов. В случае, когда число положительных оценок превышает число отрицательных,

Контент-анализ (англ. content analysis; от content - содержание) - формализованный метод изучения текстовой и графической информации, заключающийся в переводе изучаемой информации в количественные показатели и ее статистической обработке. Характеризуется большой строгостью, систематичностью.

Сущность метода контент-анализа состоит в фиксации определенных единиц содержания, которое изучается, а также в квантификации полученных данных.

Объектом контент-анализа может быть содержание различных печатных изданий, радио- и телепередач, кинофильмов, рекламных сообщений, документов, публичных выступлений, материалов анкет.

Контент-анализ начал использоваться в социальных науках начиная с 30-х гг XX в. в США. Впервые этот метод был применен в журналистике и литературоведении. Основные процедуры контент-анализа были разработаны американскими социологами X. Лассуэллом и Б. Берелсоном.

Г. Лассуэлл его использовал в конце 1930-х годов для исследований в сфере политики и пропаганды. Лассуэл модернизировал контент-анализ, ввел новые категории и процедуры, особое значение придавал квантификации данных.

Развитие средств массовой коммуникации вызвало увеличение контент-аналитических исследований в этой области. Во время второй мировой войны контент-анализ применялся некоторыми государственными учреждениями США и Англии для изучения эффективности пропаганды в разных странах, а также в разведывательных целях.

Накопленный опыт контент-аналитических исследований был подытожен в книге Б. Берелсона «Контент-анализ в коммуникационных исследованиях» (начало 50-х гг). Автором был определен сам метод контент-анализа, а также разные его виды, критерии и единицы для количественного исследования. Книга Б. Берелсона до сих пор является фундаментальным описанием, дающим понимание основных положений контент-анализа.

После обобщений, сделанных Б. Берелсоном, в США появилось много исследований, в которых контент-анализ применяется в различных научных направлениях. Наиболее интересной методической новацией была методика «связанности символов» Ч. Осгуда (1959), которая позволяла выявить неслучайно связанные элементы содержания.

Западноевропейские исследователи в использовании метода контент-анализа опирались в основном на американский опыт. Тем не менее, здесь тоже появилось несколько оригинальных методик качественно-количественного анализа содержания (Ж. Клейзер, А. Моль).

Основные процедуры контент-анализа

В настоящее время к базовым процедурам контент-анализа относятся выявление смысловых единиц и выделение единиц счета.

1. Выявление смысловых единиц контент-анализа

Смысловыми единицами могут быть:

  • понятия, выраженные в отдельных терминах;
  • темы, выраженные в целых смысловых абзацах, частях текстов, статьях, радиопередачах и т. п.;
  • имена, фамилии людей;
  • события, факты и т. п.;
  • смысл апелляций к потенциальному адресату.

Единицы контент-анализа выделяются в зависимости от содержания, целей, задач и гипотез конкретного исследования.

2. Выделение единиц счета

Единицы счета могут совпадать либо не совпадать с единицами анализа. В 1-м случае процедура сводится к подсчету частоты упоминания выделенной смысловой единицы, во 2-м - исследователь на основе анализируемого материала и здравого смысла сам выдвигает единицы счета, которыми могут быть:

  • физическая протяженность текстов;
  • площадь текста, заполненная смысловыми единицами;
  • число строк (абзацев, знаков, колонок текста);
  • длительность трансляции по радио или ТВ;
  • метраж пленки при аудио- и видеозаписях,
  • количество рисунков с определенным содержанием, сюжетом и пр.

3. Процедура подсчета

Подсчет результатов в общем виде сходен со стандартными приемами классификации по выделенным группировкам. Применяется составление специальных таблиц, применение компьютерных программ, специальных формул (напр., «формула оценки удельного веса смысловых категорий в общем объеме текста»), статистические расчеты понятности и аттрактивности текста.

Метод контент-анализа широко применяется как вспомогательное средство в психологии, социологии и др. науках при анализе ответов на открытые вопросы анкет, материалов наблюдений, результатов психологического тестирования (в частности, в проективных методиках), для анализа результатов в методе фокус-групп.

Контент-анализ — описание метода

Контент-анализ (от англ. contens содержание) — метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Не все документы могут стать объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет. Основные направления применения контент-анализа: выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта — окружающей действительности, автора или адресата); определение того, что существует только в тексте как таковом (различные характеристики формы — язык, структура, жанр сообщения, ритм и тон речи); выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа — наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике отечественного контент-анализа сложилась довольно устойчивая система категорий — знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа — лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. В практике отечественных контент-аналитических исследований наиболее, употребительными единицами анализа являются слово, простое предложение, суждение, тема, автор, герой, социальная ситуация, сообщение в целом и др. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа — контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица — «предложение». Наконец, необходимо установить единицу счета — количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаше всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации — 12—16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200—600 текстов.

Основа контент-анализа - это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа - это выяснение того, что считать; иными словами, определение единиц анализа.

Единицы эти в зависимости от целей анализа, типа информационного массива, а также ряда дополнительных причин могут быть (и реально бывают) весьма разнообразными. К ним предъявляются два естественных, но, к сожалению, обычно плохо совместимых требования. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте; в идеале хотелось бы, чтобы их выявление вообще могло быть алгоритмизовано.

Понятно, что такому требованию лучше всего удовлетворяют формальные элементы текста или же элементы, имеющие четко выраженные и однозначные формальные соответствия, например слова. С другой стороны, от единиц контент-анализа чаще всего требуется некая субъективная, да к тому же еще и зависящая от контекста значимость, делающая их распределение и динамику такого распределения диагностичными для выявления изменений в индивидуальном и общественном сознании, системах убеждений и т.д. - иными словами, единицы должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации.

Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими разнообразными способами. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения. Характеристику единиц контент-анализа необходимо предварить кратким соображением о природе анализируемого информационного массива.

В самом определении метода контент-анализа нет ничего, что препятствовало бы применению его к отдельно взятому тексту; более того, примеры такого анализа известны. Тем не менее существует ряд причин, по которым объектом контент-аналитических проектов обычно является не отдельный текст, пусть даже значительный по объему, а именно информационный массив, или информационный поток, состоящий из большого количества текстов.

Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки.

Во-вторых, большинство целей контент-анализа предопределяют его тяготение к компаративности; аналитиков чаще всего интересуют не одномоментные срезы, а динамика изменений, а если и срезы, то, как правило, «пестрые», отражающие, например, различные СМИ или сознание различных социальных групп.

Наконец, при всем разбираемом ниже разнообразии единиц контент-анализа наиболее популярными являются различные макроединицы: темы и/или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, да и новые макроединицы появляются не столь часто, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении».

Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени. Конкретное разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. (Классификация, приводимая ниже, построена с учетом типологии К.Криппендорфа, однако отличается от нее весьма существенно.)

Контент-анализ представляет собой формализованный метод сбора данных из вторичных источников и качественно-количественного анализа их содержания. Проведение контент-анализа основано на следующих принципах:

Формализации - необходимо задать однозначные правила для выявления искомых характеристик содержания;

Статистической значимости - интересующие исследователя элементы содержания должны встречаться с достаточной частотой.

Алгоритм выполнения контент-анализа представлен на рис. 16 и состоит из следующих этапов:

1. Постановка задач контент-анализа.

2. Определение системы категорий анализа.

3. Определение единицы анализа.

4. Выбор количественных и качественных характеристик текста, которые интересуют исследователя для характеристики взаимосвязи содержания с внешними параметрами.

5. Выбор источников для обследования.

6. Разработка таблиц сбора данных на каждую категорию анализа.

7. Разработка инструкций кодировщику, где описывается система правил сбора эмпирических данных, пояснения для правильного понимания персоналом процедур регистрации заданных единиц анализа, алгоритм действий.

8. Сбор информации.

9. Обработка результатов и их интерпретация.

10. Подготовка отчета.

Объектом анализа могут выступать материалы газет и других печатных изданий, содержание радио- и телепередач, кинофильмов, рекламных обращений, а также данные, полученные посредством открытых вопросов анкет или свободных интервью.

Цель исследования - выявление аспектов, касающихся объекта и предмета исследования, которые получили подробное рассмотрение в документах, вышедших в течение некоторого периода времени. Например, изучение общественного мнения по поводу нового закона о проблемах ЖКХ.

Рис. 16. Алгоритм контент-анализа

В зависимости от целей исследования можно выделить несколько типов контент-анализа:

Первый тип контент-анализа: подсчет символов (ключевых слов), содержащихся в материалах (например, упоминание торговой марки или названия фирмы);

Второй тип: дальнейшая проработка первого - это классификация символов по отношению авторов публикаций к изучаемому объекту (в положительном или отрицательном смысле);

Третий тип: анализ по элементам содержания - классификация отдельных частей документов по заданным критериям.

Четвертый тип: тематический анализ - выявление явных и скрытых тем публикаций.

Пятый тип: структурный анализ - выявление взаимоотношений различных тем публикаций. Эти отношения могут быть взаимодополняющими, развивающими одну тему, и конфликтными (когда темы работают на взаимно противоположные цели).

Шестой тип: анализ взаимоотношений различных материалов, имеющих общую цель публикаций, кроме вопросов пятого типа контент-анализа, - здесь изучается последовательность появления публикаций и отслеживается динамика характеристик содержания во времени (например, изучение реакции на предвыборную агитацию).

Категория контент-анализа - это наиболее общие, ключевые понятия, позволяющие группировать затрагиваемые темы в содержании сообщения в соответствии с выбранной классификацией (например, по проблематике), что позволяет идентифицировать содержание материалов в общем виде. Категория анализа имеет то же назначение, что и вопросы в анкете, т. е. призвана указывать характер получаемых данных.

К процедуре формирования категорий анализа предъявляются определенные требования:

Одни и те же элементы содержания не должны быть отнесены к различным категориям;

Не должно быть разногласий по поводу отнесения элемента содержания к той или иной категории, т. е. категории должны быть надежными.

Единица контент-анализа - это элемент содержания, некоторая его смысловая часть, которая раскрывает определенную категорию. Чтобы определение категории было надежным, необходимо перечислить все единицы анализа или индикаторы их присутствия (признаки наличия определенного элемента содержания). Это могут быть определенные термины, слова, выражения, предложения, имена, темы и т. д. Единицы анализа могут включать в себя оценки отношения (хорошо/ плохо) или оценки эффективности (выгодно/невыгодно) к анализируемым элементам содержания.

Если продолжить рассмотрение примера об изменении законодательства по ЖКХ, то в качестве основных категорий анализа можно выделить:

Проблемы, вынуждающие к изменению законодательства;

Ожидаемые положительные перемены, вызванные изменением законодательства;

Ожидаемые отрицательные перемены, вызванные изменением законодательства;

Конкретные предложения по совершенствованию законодательства.

Расшифровка категории «ожидаемые отрицательные перемены, вызванные изменением законодательства о «ЖКХ» может быть дана с помощью таких единиц: «квартиры скупят «новые русские», «народ попадет в кабалу» т. д.

В исследованиях сообщений средств массовых коммуникаций, где контент-анализ применим наиболее широко, выделяются некоторые «стандартные» смысловые единицы:

Понятие, выраженное отдельным словом, термином или сочетанием слов. Применение такой смысловой единицы целесообразно при изучении способов, посредством которых источник информации организует сообщение, передает свои намерения тем, кому оно направлено, например в рекламе.

Тема, выраженная в единичных суждениях, смысловых абзацах, целостных текстах. Тема является важной смысловой единицей при анализе направленности интересов, ценностных ориентации, установок тех, кто передает сообщение. Однако определение темы бывает затруднено в связи с ее неясностью в тексте. Аналитику приходится определять тему и ее границы внутри текста. Выбор темы в качестве единицы анализа подразумевает также внутреннее разделение текста на определенные части (единицы контекста), в рамках которых тема может быть определена.

Имена людей, географические названия, торговые марки, названия организаций, упоминание какого-либо события. Частота и длительность временного интервала, с которыми они присутствуют в сообщениях, могут послужить показателями их важности, значимости.