ТЕСТИРОВАНИЕ

1. Дефиниции, точки зрения, проблемы
2. СФЕРЫ ПРИМЕНЕНИЯ, ВИДЫ И СОДЕРЖАНИЕ ТЕСТОВ
3. Критерии качества тестов
4. Практика проведения тестирования

2.1. Теоретический подход к тестированию 

При использовании тестов исходят из того, что "оцененные индивидуальные реакции объясняются эмпирически ограниченным кругом личных качеств" [25, с. 120]. Это предположение отображает точку зрения дифференциально-психологической качественной теории, согласно которой "и внутрииндивидуальные различия, и переживания, и поведение, какими бы различными и односторонними они не казались, сводятся к ограниченному количеству характерных черт, диспозиций или к личным качествам, постоянным для данной личности в разных ситуациях и в разное время" [35, С.318]. Количественный учет этих особых примет личности с помощью тестов предусматривает, что их можно измерить. Это значит, что предполагаемые конструктивные черты личности должны существовать в различных степенях выражения, что эти степени выражения находятся в соотношениях, которые можно эквивалентно отобразить на градуированной шкале. Соответственно, с помощью тестов можно уловить различные степени выражения абстрактной конструкции, сделать измеряемыми и описать цифровыми величинами.

Двумя центральными стержнями классической теории тестов (КТТ) являются аксиомы свойств и измеряемости. КТТ - это теоретическая основа большинства употребляемых современных тестов. Она дает основу и оправдание тому, что результаты измерений можно рассматривать как неизменные свойства личности. Это подтверждается "возможно, простой и, вряд ли опровержимой гипотезой, что существует "собственное или истинное значение отличительной черты и что достигаемая с помощью тестов оценка Х содержит ошибки" [25, с. 120].

В дальнейшем предполагается, что после исправления ошибок измерения (Е = "error") истинное значение (Т = "true score") измеряемого свойства остается:

Т=Х-Е или Х=Т+Е,

где Х - оценка теста, 
Т - истинное значение, 
Е - ошибка измерения.

Согласно второму равенству, цена измерения складывается из истинного значения Т и ошибки измерения X. Целевая установка КТТ состоит в том, чтобы уменьшить размер ошибки измерения психологического теста и этим повлиять на точность измерения истинного значения. Для этого, исходя из позиции А.Компы, необходимо рассмотреть четыре аксиомы, представляющие собой эмпирически недоказанные гипотезы о неподдающихся наблюдению переменных Е и Т, из которых должна состоять переменная теста X.

Аксиомы классической теории тестирования

е(Е)=0,

т.е. математическое ожидание ошибки измерения равно нулю. Эта гипотеза указывает, что ошибки различных тестируемых персон взаимопогашаются и результаты в среднем выравниваются. Это предположение в принципе основывается на неоднократном тестировании одних и тех же персон одним и тем же тестом. Ввиду того, что чаще всего многократное использование одних и тех же тестов для одной персоны либо невозможно, либо ведет к искаженным результатам через "эффект тренировки", аксиому квалифицируют достаточно абстрактной и эмпирически непроверяемой. 

р(Е,Т)=0, (2)

т.е. ковариация ошибки с истинным значением теста равна нулю. 

p(Ei,E2)=0, (3) 

т.е. ковариация между ошибками теста X1 и теста X2 равна нулю.

Эта гипотеза ввиду невозможности ее эмпирической проверки также может оказаться искусственной. Она свидетельствует о том, что ошибки, допускаемые при тестировании в силу "страха при тестировании", должны быть независимы друг от друга, или положительная корреляция между ошибками должна ликвидироваться через другие компоненты ошибок. 

(E1,T2)=0, (4)

т.е. ковариация ошибки измерения в одном тесте X1 с ожидаемым значением в другом тесте X2 равна нулю.

Ошибку Е можно объяснить как случайную величину, которая компенсируется при повторных измерениях (у одного человека или у совокупности в целом). Если отклонения наблюдаемого значения Х относительно истинного значения Т есть случайная величина, то Т можно оценить по средней оценке многократного наблюдения значения X.

Из аксиом КТТ можно с помощью некоторых преобразований вывести показатели достоверности (надежности) и действительности (валид-ности) инструмента измерения, которым и предполагается измерить истинное значение Т.

2.2. Сферы применения тестов 

Возможность, предполагаемая или констатируемая специалистами, - с помощью тестирования "получить представление об испытуемом.., надежные и современные сведения о его возможностях и поведении", "установить характерные черты поведения, раскрыть способности, определить уровень развития или выявить отдельные детали общей картины личности" [37, с. З, 41], познать, "каково будет индивидуальное нанесение ущерба и какие возможности "имеются у испытуемых", какой тренд в их поведении заметен или не заметен" [25, с. 117], определяет достаточно широкий спектр сфер, в которых мог бы быть полезен метод:

1) тестирование используется в тех структурах, которые призваны делать квалифицированные консультации по продолжению образования, выбору профессии обратившимся из числа молодежи, затрудняющимся принять самостоятельное решение, временно незанятым и другим категориям населения; 

2) объектом тестирования являются школьники и иные категории обучающихся. В этом случае тесты должны способствовать отбору наиболее способных испытуемых и применяются при селекции для перехода из одного типа школ в другой (например, из средней - в гимназию), при допуске к выпускным или приемным экзаменам; 

3) тесты используются в учебных структурах для контроля успеваемости, причем в данном случае они должны заменить "неточные и ненадежные" оценки, которые были бы сравнимы в разных городах, странах, школах и классах; 

4) в исследовательской работе и психотерапевтических мероприятиях, прежде всего в процедуре диагностики; 

5) на предприятиях и в организациях с целью осуществления работы с персоналом.

Брамбирг [20, С.280] дает детальный обзор учреждений ФРГ, которые в своих структурных подразделениях используют тестирование как один из методов, квалифицирующих такое состояние испытуемого, как "пригодность", в их числе:

психологические службы государственного Комитета по труду; 

Психологическая диагностика пригодности на предприятиях служит мероприятиям, проводимым с персоналом в сферах:


При отборе поступающих на работу выделяют три основные ситуации, в которых при постановке различных задач применяется психологическое тестирование:

1) в наличии имеется несколько свободных мест и есть только один претендент. Поступающий должен пойти на то место, которое ему больше всего подходит;

2) количество вакантных мест и число претендентов одинаковы. Необходимо добиться оптимального распределения;

3) свободно только одно место, а в наличии имеется несколько претендентов, из которых необходимо найти наиболее подходящего.

Согласно позиции Хентце, применение психологических тестов при найме наиболее целесообразно там, где в короткое время проверяется большое число кандидатов [20, С.280]. На "постоянно большое количество претендентов" при отборе как на фактор-предпосылку тестирования указывает Бертхель [10, с.161]. А.Компа смысл тестирования видит при соблюдении следующих моментов:

2.3. Виды тестов и их содержание

2.3.1. Классификации тестов

Работа с персоналом в производственных условиях подтвердила, что предпосылками для осмысления применения тестов является обнаружение того способа поведения, который является наиболее важным для выполнения профессиональных обязанностей, необходимых на данном вакантном месте работы.

Тестирование в соответствии с этим должно отвечать следующим основным требованиям [48, с.182]:

В соответствии с выбранными группировочными признаками тесты классифицируют различными способами. Наиболее укрупненная классификация содержит две группы тестов:

Представляя работающего индивида в виде двух характерологических компонент - его способностей (возможностей) и личностных качеств, Г.Шанц представляет классификацию психологических тестов как двухэлементную, включая в нее - 

Придерживаясь той же точки зрения о значимости способностей и личных качеств испытуемого как важных факторов успешной производственной деятельности и социальной коммуникации в коллективе, Р.Штейнбух и К.0лферт сформировали более детализированную классификацию, подразделив каждый из первоначально отобранных элементов на четыре субгруппы.

Тесты способностей, с помощью которых исследуются общие способности к успешному и производительному труду, интеллектуальные способности, специфические дарования и специфические трудовые способности (табл.).

Таблица

Общие тесты производительности Служат тому, чтобы исследовать духовные признаки работоспособности кандидата, опираясь, например, на его способность концентрировать внимание и др.
Тесты на интеллект С их помощью исследуются общий интеллект при ссылке на общие умственные и мыслительные способности кандидата, или специфический интеллект, например, владение языком, ловкость в счете, мыслительные способности, комбинационные способности, пространственное воображение
Специальные тесты дарований Предполагаются для установления, например, технических дарований, беглости (ловкости) пальцев и сноровки
Специальные тесты производительности Служат определению поведения в экспериментальной производственной ситуации, например, через проверку сенсорных или моторных функций

Личностные тесты прежде всего предназначены для установления интересов, склонностей, внутренних установок, социальной манеры поведения, свойств характера:

Оперируя в принципе теми же понятиями, но обозначив основные характеристики трудящегося индивида через работоспособность (производительность) - личность - интеллект, Бертхель разработал трехэлементную классификацию психологических тестов, в которую вошли:

Классификация тестов по Линерту [29, с.121], являясь одной из широкораспространенных, также трехэлементная с детализированным разложением каждой из групп на однородные субгруппы:

1) Интеллектуальные тесты 

2) Тесты производительности 

3) Личностные тесты

Дальнейшая дифференциация Линнертом отобранных критериев стала основанием для построения еще ряда тестовых группировок:

1. По степени общности и применимости 

2. По признаку основного параметра 

3. По признаку зависимости от интерпретации 

4. По проведению тестирования 

5. По пониманию речи 

6. По виду ответов на задания 

В классификации, предложенной Пирлменом, содержатся тесты "когнитивных способностей", в число которых ученый включил:

2.3.2. Содержание различных видов тестов

Имея разную направленность, психологические тесты, соответственно, неодинаковы по своему содержанию. Например, интеллект измеряется, как правило, через способность к труду, его производительность, что предполагает необходимость принимать это во внимание, поскольку "личность должна анализироваться не как сумма независимых признаков" [20, с.280].

По частоте своего применения психологические тесты можно выстроить в иерархический ряд, начинать который будут тесты на интеллект, затем последуют тесты производительности и замкнут его личностные тесты [20].

Тесты на интеллект как инструмент отбора персонала распространены особенно широко. При достаточно частом их использовании на практике до сих пор не снят с повестки дня вопрос: "Что есть вообще интеллект?". В литературе при значительной череде дефиниций феномен интеллекта, как считают многие специалисты, описан почти неопределенно. Формулировки простираются от упрощенных, "насмешливо-пессимистических резюме, говорящих, что интеллект - это то, что едва ли измеряется тестом на интеллект" [10, с. 170], до комплексных высказываний, в которых интеллект квалифицируется как успешность общих способностей определенной внутренней культуры.

Учеными установлено, что интеллект не наблюдаем прямо, наблюдаемы только различные способы поведения человека в неодинаковых ситуациях. Поведение как раз и является той базой, на которой могут быть "найдены" общие факторы, заслуживающие обозначения "интеллект".

Интеллект, считает Бертхель, всегда будет теоретической конструкцией, что должно быть связано с "операционными дефинициями в измерительных операциях" [10, с.170]. При этом интеллект содержит, констатирует ученый, "пучок связанных факторов, которые состоят из отдельных сфер способностей..." [там же].

По своим теоретическим предпосылкам тесты на интеллект принадлежит, по оценкам Кормана, к "очень релостабильным и валидным" психологическим методам. Так как эти тесты, отмечает ученый, особенно хороши для оценки профессионально-образовательного успеха, значит, они представляют стандарт профессиональной диагностики пригодности [см.: 20].

Общий уровень интеллекта достаточно хорошо, согласно опыту в "дойчговорящих" странах, определяется через дифференциацию высокоодаренных кандидатов с помощью "Adranced Progressive Matrices", или Матриц Ровена. Английский ученый адаптировал свои матрицы, созданные более 25 лет назад, на предприятиях многих стран мира, однако их применение, по оценкам практиков, целесообразно как дополнительное.
Интеллект многомерен, поэтому у специалистов вызывают интерес тесты, способные охватить его специальные, или специфические качества. Среди других наиболее широко используются:

Общий уровень интеллекта рассчитывается дополнительно из оценок, полученных по "интеллектуальным структурам".

"1ST" охватывает в 9 субтестах следующие величины: 

"LPS" состоит из 14 субтестов и дает возможность произвести оценку в следующих сферах:

Гамбургский тест на интеллект "HAWIE" предлагает взрослым для выполнения два вида заданий: 

Одна из существенных проблем в использовании тестов на интеллект для селекции персонала, по мнению профессионалов, состоит во многих случаях в "неясном профиле требований к нанимаемым кандидатам".

Тесты производительности применяют для измерения как общих, так и специфических способностей и навыков. Целью такого тестирования является "оценка моментных стандартов производительности" [43, с.304].

Содержание общих тестов производительности подчинено измерению таких способностей кандидата, как умение концентрироваться, проявлять активность в производственных ситуациях. Тесты, выявляющие способность концентрироваться, должны измерить работоспособность при длительной и монотонной нагрузке. Наиболее известными и эффективными являются "Aufmerksamkeit-Belastwigstest" Брихенкампа, "Konzentration-Leistungstest" Линерта, "Konzentration-Verlauf-Test" Абеля.

Показатель такого тестирования складывается из "смешанной производительности", которая детерминируется через быстроту обработки и ошибочную смелость, например, при сложении чисел, обведении букв или решении простых арифметических задач.

Специальные тесты производительности имеют особое значение для водителей автомобилей, профессий индустриального и ремесленного профиля. Содержание тестов моторных реакций определяется измеряемыми показателями, в число которых, например по Флейхману [16], включается 11 характеристик: 

Сенсорные реакции чаще всего определяются через тесты на обоняние и осязание.

Тесты производительности применяют в рамках профессионального отбора и профессиональных и образовательных консультаций.

Личностные тесты. Профессиональный успех часто зависит не только от профессионально-технической квалификации кандидата, но и от его личности. Личным качествам особенное значение придается йри найме на руководящие должности для выяснения "признаков социальной компетентности" претендента, а также на те вакантные места, которые требуют наличия (недопустимости) определенных черт характера, силы воли, умения приспосабливаться.

Личностные тесты содержат в себе "методически очень разные приемы, в основе которых лежат различные теории о личности и выдвигаются соответствующие личностные величины" [20, С.284].

Личностные характеристики нанимающихся измеряются на основании данных персональных опросных листов (анкет) и специальными проекционными тестами.

Широко известным является "Freibuier Personlichkeits-InventaT-Test" (FPIT), разработанный Фаренбергером, Селгом и Хамнелем, посредством которого определяются представленные на 12 субшкалах такие личностные величины, как 

Пятифакторные решения через внутреннюю корреляцию субшкал в итоге дают следующую картину личности:

Проекционные личностные качества испытуемого фиксируют через оценку достаточно своеобразных заданий, неординарность которых читается уже в некоторых их названиях. Задачи "на истолкования" часто представлены "чернильными кляксами" Роршах-теста, картинками Thematic Apperception Test; "на выбор раздражителей" - фотопортретами Szondi-Test, красками (цветовой гаммой) L scher-Test [10, с. 170].

В противоположность личным опросным листам проекционные тесты в своей интерпретации сильно зависимы от субъектавных оценок тестирующего. Более того, личностные тесты вообще, а проекционные в еще большей степени "наносят ущерб личностному праву кандидата, вторгаясь в сферу его частной жизни" [10, с. 171]. Поэтому, по мнению специалистов, современная практика их применении в селекции персонала должна иметь ограничения. Согласно позиции Бертхеля, "не все психологические тесты допустимы без определенного согласия тестируемого" [10, с.172]. Из-за профессионально-этических и правовых проблем, считает Брамбринг, они могут использоваться только в консультациях по диагностике пригодности, но не в ситуациях отбора [20]. "Дифференцированный тест интересов", сконструированный Тодгом, по мнению Хентце, сразу же приводит к предварительному - по факту профессиональных желаний - отбору групп кандидатов, причем ответы испытуемых, подстраивающихся под "социально-желаемые тенденции", часто ведут к фальсификации результатов [20].

Требования производственных ситуаций, как правило, "мультиразмерны", т.е. для успешного их познания и разрешения требуется комплекс отличительных черт, качеств и умений исполнителя. Для определения такой комплексной пригодности кандидата разработаны так называемые батареи тестов, которые представляют собой "сконструированные на базе тестовых теорий связанные тесты" [20, с.286]. Одна из известных тестовых батарей "Benifeeignungs-diagnostik", созданная Шмале и Шмвдтом, достаточно широко используется для диагностики профессиональной пригодности. Для того чтобы результат пригодности и профессионального успеха кандидатов был валидным, специальные, обусловленные профилем деятельности тестовые батареи разрабатываются крупными подразделениями, такими, как, например, Государственное учреждение по труду, только для внутреннего использования.