Читайте также: |
|
Для определения объема выборки, достаточного для получения определенного уровня достоверности статистических оценок характеристик распределений переменных, связей между ними и т.п., можно пользовать статистические таблицы. Например, для проверки гипотезы H0 при p £ 0.05 о равенстве коэффициентов корреляции, рассчитанных для двух выборок, составляющих величины порядка 0.5 и 0.6, с применением z-преобразования Фишера и t-критерия, объем каждой выборки должен превышать 50 объектов [Мюллер и др, 1982, с. 170-175]. Исходя из планируемых объемов выборок, можно определить достижимую точность статистических оценок, см. например, таблицу зависимости существенности различий подвыборок от их объема [Ядов, 1999, с. 117].
Существует эмпирически установленное правило, что количество объектов (объем выборки) должен превосходить количество переменных, описывающих эти объекты, как минимум на порядок: если измерения даны в 10 переменных, минимальный объем выборки составит 100 объектов [Дрейпер, Смит, 1987, с. 144] (см. подразд. Данные). Для линейной зависимости между двумя переменными вида
y = b + kx (полная запись: y = bx0 + kx1)
минимальный объем выборки составит 30 объектов, поскольку уравнение включает три переменные (у, x0, x1). Заметим, что для квадратической и кубической зависимостей минимальное количество объектов составит соответственно 40 (у, x0, x1, x2) и 50 (у, x0, x1, x2, x3).
Следует учитывать, что увеличение объема смещенной выборки не предотвращает получение артефактных результатов, напротив, чем больше объем такой выборки, тем больше вероятность того, внешняя валидность исследования пострадает, а выводы быдут ошибочными [Кимбл, 1982, с. 146].
Репрезентативность и состав выборки. Для районированных и стратифицированных выборок репрезентативность обеспечивается пропорциональным представительством районов и страт только в случае однородности генеральной совокупности. Пропорциональность нарушается, если свойства районов существенно различны. Так, общенациональная выборка ФРГ, используемая для социологических опросов, включала 2000 респондентов, а после присоединения пяти земель Восточной Германии (22% населения), весьма отличающихся от 10 западных земель, выборка была увеличена до 3500 респондентов (т.е. не на 22%, а на 75%). Важно, что для выборок, построенных этими способами, репрезентативность всей выборки достигается адекватностью объема каждой группы. Занижение или завышение представительства какой-либо одной группы может нарушить репрезентативность всей выборки и привести к артефактным результатам иследования. Если предполагается, что тест, должен быть применим к испытуемых трех различающихся групп, то репрезентативная выборка должна включать по 100 представителей от каждой из этих групп, а 300 представителей одной из них не будет репрезентативной выборкой [Клайн, 1994, с. 170].
В длительных исследованиях с многократными оценками (тестированием) групп может происходить изменение состава выборки за счет выбывания испытуемых (“experimental mortality” [Кэмбелл, 1980, с. 46]). В зависимости от причин выбывания, оно может приводить к серьезным артефактам. Например, при исследовании развития мотивационной сферы у студентов результаты могут существенно переоценивать темп такого развития, поскольку все слабо мотивированные студенты либо оставят учебу, либо будут отчислены (ср. [Кэмпбелл, 1980, с. 62]). Сокращение объема может приводить к существенному смещению выборки, которое не всегда можно компенсировать просто удалением выбывших испытуемых из обработки на всех этапах исследования, включая самые ранние, так как в результате такой компенсации выборка уже в исходном состоянии будет смещенной. Неравномерность выбывания испытуемых в контрольных и экспериментальной группах может приводить к их существенной неэквивалентности.
Подбор контрольных групп. Планирование эксперимента или квазиэксперимента с высокой степенью контроля требует формирования нескольких групп исследуемых субъектов. Такие группы должны быть однородными и уравненными по всем переменным, кроме одной - составляющей предмет сопоставления. Так, для изучения соотношения генетических и средовых факторов при формировании индивидуальности могут быть отобраны однородные группы испытуемых, различающихся по одной переменной, оценивающей степень генетической общности: (1) монозиготных, (2) дизиготных близнецов, (3) сиблингов *, (4) полусиблингов, (5) испытуемых, находящихся в двоюродном родстве (кузенов), (6) их родителей, (7) лиц, гарантированно не являющихся родственниками между собой и с испытуемыми, включенными в перечисленные группы. Это деление должно быть дополнено разделением на группы по общности средовых характеристик (близнецовой, сиблинговой, родительско-детской, расширенной семейной — см. подробно в работе [Григоренко, 1998]). Заметим, что объектами изучения, включенными в состав этих выборок не обязательно должны быть люди. У животных значительно легче контролировать степень родства и формировать из них эквивалентные группы. Использование “чистых линий” животных может уравнять группы по генетическим и поведенческим характеристикам, хотя в этом случае невозможно применение стандартных психологических тестов.
Все сопоставляемые выборки должны быть репрезентативны (по отношению к генеральной совокупности) и уравнены, эквивалентны по всем характеристикам, кроме воздействия независимой переменной. Эквивалентность групп может быть достигнута различными способами:
(1) рандомизацией, т.е. случайным подбором; строго говоря, только группы, отобранные способом рандомизации могут быть эквивалентными;
(2) подбором пар, члены которых контрастны по значениям переменной, определяющим сравниваемые группы; полагают, что этот способ достижения эквивалентных групп “применяется лишь в силу устойчивой и дезориентирующей традиции”, он пригоден лишь как дополнение к рандомизации, но замена им рандомизации недопустима даже в квазиэкспериментальных планах [Кэмпбелл,1980, с. 68, 135];
(3) различными комбинациями рандомизации и подбора пар; Кэмпбелл считает эффективным прием “образование блоков”: испытуемых подбирают по парам, “тщательно уравненные по показателям предварительного тестирования или по связанным переменным”, а затем в случайном порядке одного из них включают в экспериментальную, а другого - в контрольную группу [Кэмпбелл, 1980, с. 68, 135]. Готтсданкер предлагает использовать случайный отбор групп с выделением слоев. (выделение слоев - вариант стратифицированного, серийного отбора, см. выше): всю популяцию разделяют на “слои” по какой-либо характеристике, и из каждого слоя случайно отбирают равное число представителей. По оценке Готтсданкера этот прием обеспечивает очень хорошую внешнюю и внутреннюю валидность [Готтсданкер, 1982, с. 176, 178].
Формирование групп по какому-либо контрастному признаку, например, групп, различающихся по полу, неизбежно приводит к систематическому смешению независимой переменной (пол) с сопряженными индивидуальными характеристиками [Готтсданкер, 1982, с. 164]. К артефактным результатам (нарушению внутренней валидности) приводит формирование групп по признаку предельно больших и малых значений какой-либо характеристики, так, что в одну группу входят испытуемые с низкой, а в другую - с большой выраженностью признака. В этом случае весьма вероятно, что влияние независимой переменной (условий) будет неэквивалентным в экспериментальной и контрольной группе, что называют “эффектом статистической регрессии” [Кэмпбелл, 1980, с. 134]. Заметим, что такой отбор испытуемых в группы является формальным препятствием применения регрессионого анализа, поскольку нарушено требование нормального распределения признака в выборке.
В квазиэкспериментальных исследованиях, когда уравнять группы случайным отбором или манипулируя составом невозможно, прибегают к “сбалансированным” планам исследования. Это в некоторой степени компенсирует неэквивалентность групп [Кэмпбелл, 1980, с. 139-140].
Важно, чтобы свойства сформированной выборки и групп находились в соответствии с типом выполняемого исследования, и не были ниже необходимого уровня требований. Для исследований, проводимых по плану истинного эксперимента необходимо построение полностью рандомизированной, репрезентаттивной выборки, несмещенных эквивалентных групп. Это весьма трудоемкая система процедур, но любое отклонение от правил формирования выборки может привести к нарушению валидности эксперимента и к ошибочным выводам. Точное выделение оснований эквивалентности и контраста групп и подгрупп — необходимое условие выявления закономерной связи независимой и зависимых переменных. В то же время любой отбор может быть источником нарушения репрезентативности выборки, т.е. ее соответствия генеральной совокупности. Если обеспечить рандомизацию выборки и эквивалентность групп не удается, то, независимо от строгости выполнения всех остальных процедур планирования, исследование может быть лишь квазиэкспериментальным или доэкспериментальным. Если исследование может быть проведено только на естественных группах, или невозможно формирование контрольной группы, оно не может выйти за рамки доэксперимента. Важно заметить, что построение выборки в соответствии со всеми основными требованиями повышает валидность исследования, снижает вероятность артефактных выводов, независимо от того, проводится это исследование по плану истинного эксперимента, квазиэксперимента или доэксперимента (см. подразд. Типы исслед).
IV.3. Соответствие исследования научным стандартам
В качестве эталона для оценки планирования и проведения исследования используют понятие “ безупречный эксперимент”. Термин “эксперимент” применен в данном случае, поскольку это наиболее развитый тип исследования, позволяющий контролировать наиболее строгим образом наибольшее число факторов, влияющих на достоверность вывода.
Различные стороны планирования исследования, характерные для “ безупречного эксперимента ”, раскрываются в понятиях: (1) идеального эксперимента, в котором устранены все источники систематических смешений *; (2) бесконечного эксперимента, в котором бесконечное число проб применяется к бесконечно большому числу испытуемых, что позволяет учесть влияние бесконечного количества побочных переменных — источников несистематической изменчивости; (3) эксперимента полного соответствия, обладающего абсолютной внешней валидностью и являющегося исчерпывающей копией реальности. По определению Р. Готтсданкера, “все три вида безупречного эксперимента нереальны. Идеальный эксперимент является невозможным, эксперимент полного соответствия — бессмысленным, а бесконечный — тем и другим вместе” [1982, с. 54]. Добавим, что эксперимент полного соответствия не может быть точной моделью реальности, “абсолютной” теоретической конструкцией, поскольку не может выйти за пределы знания об изучаемом объекте, предвосхищаемого гипотезами (см. разд. II.8, IV.2.3, IV.2.2.3). Однако эти идеализированные модели указывают на наиболее “уязвимые”, подлежащие строгому контролю аспекты планирования реального исследования, которые содержат угрозы систематического смешения переменных, влияния несистематических факторов, использования неадекватных моделей изучаемой реальности.
Оценка соответствия исследования стандартам и нормативам дается в терминах репрезентативности, надежности и валидности. Репрезентативность - наиболее общая, фундаментальная характеристика исследования; эта характеристика может рассматриваться как основание надежности и валидности исследования; надежность, в свою очередь, является предпосылкой валидности. Нарушения требований репрезентативности, надежности и валидности приводят к неверным, артефактным выводам.
Репрезентативность, надежность и валидность применимы для оценки исследования любого типа — доэкспериментального, квазиэксперимента и истинного эксперимента.
IV.3.2. Репрезентативность
Репрезентативность (от англ. representativeness, to represent - представленность, представлять) - характеристика соответствия теоретических, инструментальных, эмпирических составляющих исследования свойствам изучаемой реальности. Оценка репрезентативности показывает, насколько точно представлены свойства предмета изучения в данном исследовании, насколько точно и полно могут представить его свойства используемые конструкты и методики и т.д.
Репрезентативностью должны обладать все используемые в исследовании теоретические конструкты, приемы выделения и описания переменных, методические приемы, алфавит описания объекта изучения, выборка испытуемых и т.д. Репрезентативность - наиболее обобщенная характеристика всех составляющих исследования, низкий уровень репрезентативности исключает высокую надежность и валидность исследования и в этом смысле является их основанием и предпосылкой.
Р.Готтсданкер определяет репрезентативность как степень приближения оцениваемого исследования (эксперимента) к безупречному эксперименту (см. разд. СООТВЕТСТ). Поскольку безупречный эксперимент - лишь идеализированная модель исследования и в полной мере принципиально нереализуем, то реперзентативность исследования определяют, сравнивая его план (и другие составляющие) с образцовыми (см. [Готтсданкер, 1982, с. 55-56; 441-442]).
Репрезентативность выборки - весьма развитое понятие; его особенности, приемы достижения и контроля высокой репрезентативности выборки подробно рассмотрены в подразд. ВЫБОРКА.
Репрезентативность методики — соответствие приемов исследования свойствам изучаемого объекта (см. также [Корнилова, 1997]). Репрезентативность методики может позволить приблизиться к описанию объекта исследования в полноте его предполагаемых свойств. Чем выше репрезентативность методики, тем больше ее возможности в реконструировании изучаемой реальности (см. раздел МЕТОД). Эта характеристика методики нарушена, если ее применение навязывает объекту артефактные свойства (см. подразд. АРТЕФАКТ) или она не пригодна для фиксации важных показателей. Эту характеристику методик психологического исследования можно оценить косвенно, по соответствию основным объяснительным принципам (см. гл. II). В понятие репрезентативности методических средств входит также сооответствие применяемых способов обработки реальной структуре данных - шкалам, в которых они измерены, особенностям распределения, объему выборки и т. д. (см. подразд. СТАТИСТИКА).
Репрезентативность переменных - соответствие независимой, зависимых, дополнительных переменных харктеристикам исследуемого объекта и условиям, создаваемыми (воспроизводимыми) в данном исследовании, а также в других, как проведенных, так и возможных. Репрезентативность переменных - важный фактор в формировании внешней валидности исследования (см. подразд. ВН ВАЛ).
Репрезентативность результатов — соответствие свойств изучаемого объекта, выявленных в конкретном исследовании его теоретически предполагаемым или представленным в популяции свойствам, а также множеству результатов, полученных в других исследованиях. Очевидна связь данного понятия с понятиями внешней валидности и надежности (см. подразд. ВАЛ. НАДЕЖН). Этот вид репрезентативности доказывается сопоставлением интерпретаций, развиваемых в данном исследовании, с альтернативными интерпретациями (см. разд ПУБЛ.ОБСУЖД). Репрезентативность результатов обеспечивается точным соответствием цели, задач, плана исследования, методических приемов сбора и обработки данных.
IV.3.3. Надежность
Надежность - одна из наиболее важных характеристик результатов исследования и исследовательских инструментов, оценка их независимости от случайных, несистематических факторов (см. смешение *; подразд. IV.3.2.3). Чем шире пределы вариативности несистематических факторов, в которых сохраняется устойчивость результатов, тем выше их надежность.
Понятие “надежность” употребляется в двух значениях.
Дата добавления: 2015-11-14; просмотров: 88 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Парапсихология 5 страница | | | Надежность как характеристика воспроизводимости измерений и результатов исследования. 1 страница |