Оптимизация времени тестирования учебных достижений

УДК 378 Жирякова Ирина Анатольевна к.т.н., проректор по учебно-методической работе

Восточноевропейский университет экономики и менеджмента г. Черкассы

Молодык Татьяна Владимировна

преподаватель кафедры Информационных технологий та экономической кибернетики

Восточноевропейский университет экономики и менеджмента г. Черкассы

Оптимизация времени тестирования учебных достижений

Тестирование учебных достижений представляет собой достаточно объективный метод измерения уровня знаний. Для того, чтобы результаты тестирования были действительно объективными необходимо, чтобы тестирование было валидным [1, 2]. Приемлемая валидность теста обеспечивается выполнением двух требований:

- использование теста с достаточно высоким коэффициентом надежности;

- корректное исполнение процедуры тестирования: основное требование здесь заключается в том, чтобы испытуемые находились в равных условиях и не испытывали дополнительных трудностей при выполнении тестовых заданий, например, плохое освещение, сбои в работе компьютеров, чрезмерное утомление и прочих.

Кроме того, одним из наиболее значимых факторов, влияющим на результаты, является время тестирования. Педагогические тесты преследуют вполне определенную цель, например, ранжировать испытуемых по уровню достижений. На достижение этой цели влияет как качество тестовых заданий, так и их количество.

Общее время тестирования определяется двумя главными факторами – количеством и трудностью заданий. Должно ли это время быть ограниченным или не ограниченным – определяется конкретной ситуацией, в которой применяется тест.

Многие авторы согласны с тем, что правильное определение времени тестирования является важным фактором, влияющим на качество результатов теста. Например, Майоров в [3] отмечает, что каждый тест имеет оптимальное время тестирования, уменьшение или превышение которого снижает качественные показатели теста. Аванесов считает тест кратковременным испытанием, а потому полагает, что время педагогического тестирования не должно превышать, примерно, сорок минут [4]. Ранее он же отмечал, что время выполнения теста является важным системообразующим фактором при разработке теста. Повышенное внимание этому вопросу уделяется по той причине, что неверно установленное время тестирования не позволяет тестовым заданиям достичь своей цели – проверить – знает ли испытуемый проверяемую дидактическую единицу или ее составную часть.

Как у слишком большое так и слишком малое время тестирования имеет свои негативные последствия. При малом времени тестирования слабые учащиеся не справятся с тестом потому, что не успеют даже разобраться, о чём их спрашивают, в то время как сильные – потому, что не имели достаточно времени на выполнение заданий. У всех испытуемых будут примерно одинаково низкие индивидуальные баллы, то есть произойдет уменьшение дисперсии исходных тестовых баллов испытуемых, а это означает, и снижение дифференцирующей способности теста. Результаты такого теста не будут объективно отражать уровень подготовленности учащихся. При слишком большом времени выполнения теста сильные учащиеся, досрочно завершив тестирование, в оставшееся время начнут вести себя неадекватно требованиям процесса тестирования. Например, когда остается ответить на последний вопрос, испытуемый, зная, что может в любой момент правильно ответить на него, перестает интересоваться собственным тестированием и начинает, например, подсказывать соседям. Другие испытуемые, будут долго сидеть над заданиями, не решаясь выбрать ответ. Это вызовет у них утомление, снижение концентрации внимания, расслабление, что также снизит точность оценок тестирования.

Количество заданий теста и время тестирования – тесно связанные и, в определенном смысле эквивалентные характеристики, но определяющим является, все же является время тестирования, поскольку оно задает порог утомления, за которым тест начинает терять свои измерительные свойства.

Теоретически рассчитать это время невозможно, поэтому рекомендуется использовать эмпирические данные по результатам первичной апробации теста. При наличии опыта, еще на этапе разработки тестового задания, можно примерно оценить время его выполнения. Суммарное время по всем заданиям даст общее предполагаемое время тестирования.

Согласно Черненко [5], в первые 9 минут эксперимента объем информации воспринимаемой осознанно, как по зрительному, так и по слуховому каналам, достигает своего максимума. Далее, в течение последующих 18 минут плавно, но незначительно снижается, а в последующие 9 минут для зрительного канала достигает первоначального значения, для слухового канала достигает первоначально значения в течение 18 минут. По истечении 45 минут относительный объем осознанно воспринимаемой информации довольно значительно падает.

Если предположить, что занятия по теоретическим дисциплинам и тестирование требуют равного высокого интеллектуального напряжения, то из приведенной зависимости следует, что утомляемость испытуемых начинает заметно проявляться через время tу равное 36 минутам после начала тестирования. Оптимальное время тестирования tо соответствует моменту, когда положительный эффект, обусловленный увеличением времени тестирования будет компенсирован отрицательным воздействием утомления испытуемых. Время tо должно быть немного больше времени tу - запаздывание обеспечивает попадание в область максимума дисперсии тестовых результатов. Тогда из этих данных следует, что tо примерно равно 40 - 45 мин. Эти значения находятся в удовлетворительном согласии с рекомендациями, ограничивать число заданий теста примерно 30-50 заданиями. Если на одно задание отводить 30-60 секунд, то общее время тестирования составит примерно 50 минут. Буравлев А.И. и Переверзев В.Ю. в [6] показали, что 50 заданий теста с критериально-ориентированной интерпретацией могут обеспечить надежность результатов, равную 0,9. Иными словами, тест из 50-60 заданий, с одной стороны, обеспечивает достаточно высокую надежность, а с другой - эффект утомления для такого теста еще слабо влияет на результаты.

Черненко В. В. отмечает, что источником систематической погрешности может стать и пренебрежение суточным и недельным распределением момента начала тестирования. В частности, проведение тестирования в послеобеденное время приведет к снижению результатов по сравнению с утренним тестированием. Пренебрежение этим эффектом может крайне негативно сказаться на результатах нормативно-ориентированного тестирования. Получается, что ранг испытуемого зависит от того, когда его тестировали - утром или вечером.

Аналогичный эффект проявляется при проведении тестирования в различные дни недели. При определении выборки стандартизации необходимо указывать день недели и часы тестирования. Это особенно важно для тестов с нормативно-ориентированной интерпретацией тестовых результатов. По данным Анастази результаты тестирования интеллекта для одного и того же испытуемого в начале недели могут дать показатель равный 110, а в конце недели - 80. Вполне возможно, что это связано со снижением работоспособности к концу недели.

Таким образом, при определении времени тестирования необходимо учитывать следующие рекомендации:

- время тестирования определяется по расположению максимума дисперсии тестовых результатов и не должно превышать 60 минут;

- число заданий теста не должна превышать 60, в предположении, что на выполнение одного задания требуется не более одной минуты;

- тестирование необходимо проводить в первой половине дня;

- тестирование желательно проводить не позднее середины недели.

Литература:

1. Ким В.С. Тестирование учебных достижений. Монография. – Уссурийск: Изд.УГПИ, 2007. – 214 с.

2. Кратко О.Г. Тестування як інструмент оцінювання результатів навчання в системі дистанційного навчання // Мат. Семінару «Технології дистанційної освіти: організаційне, методичне та програмне забезпечення» – Київ: УАРМБО, Черкаси: СУЕМ, 26 березня 2010.

3. Майоров А.Н. Теория и практика создания тестов для системы образования. – М.: «Интеллект-центр», 2001. – 296 с.

4. Аванесов В.С. Основы научной организации педагогического контроля в высшей школе. – М., МИСиС, 1989. – 167 с.

5. Черненко В.В., Котенкова Н.А., Лобанова И.В. Пряженникова О.А. О механизме возникновения систематической погрешности при тестировании уровня интеллектуальных способностей // Мат. Всерос. НТК посвященной 300-летию военного, военно-морского и высшего профессионального образования в России. Т.1. Военно-исторические, военно-педагогические, гуманитарные и социально-экономические вопросы. ТОВМИ им С.О. Макарова. – Владивосток, 2000. – С. 156-158.

6. Буравлев А.И., Переверзев В.Ю. Выбор оптимальной длины педагогического теста и оценка надежности его результатов. [Электронный ресурс]. Режим доступа http://www.e-joe.ru/sod/99/2_99/st160.html.