Кузембекова Ж.Ж.
Казахский национальный университет имени аль-Фараби,
Алматы
Интерпретация тестовых результатов on-line тестирования
Преимущество on-line тестирования
заключается в том, что оно позволяет строить быстрые статистические анализы при
большом количестве тестируемых, а также заменяет ряд традиционных видов
контроля уровня владения иностранным языком.
Для того, чтобы получить квалификацию
тестового задания, следует определить статистические характеристики тестовых
заданий заданий.
По
мнению В.С. Аванесова, «тестовое задание – это составная единица теста,
отвечающая требованиям технологичности, формы, содержания и, кроме того,
статистическим требованиям» [1, 163].
Технологичность
– является одним из критериев к тестовым заданиям. Под технологичностью
подразумевается то, что процесс тестирования осуществляется с помощью
технических средств. Как отмечечает В.С. Аванесов, задания становятся
технологичными, если их содержание четко и быстро понимается тестируемыми, а
форма заданий способствует процессу компьютеризации тестирования [там же, 163].
Технологичность on-line тестирования проявляется в экономии времени при
проведении тестирования, уменьшении времени, отводимого на проверку ответных
листов (если при традиционном письменном тестировании могли использоваться
специальные трафареты, то при on-line тестировании применяются новые
компьютерные программы), стандартизации и ускорении самой процедуры
тестирования, сопровождающейся повышением репрезентативности его результатов и возможностью применения статистического
анализа результатов языковых тестов, удобстве массового on-line тестирования и
др.
В современной мировой тестологии, как
отмечает В.С. Аванесов, тестовые задания должны пройти ряд статистических
обработок [1]:
Этап статистической обработки, вслед за
Т.М. Челышковой [2], В.С. Аванесовым [1], можно разбить на несколько
этапов.
Первый
этап связан с формированием матрицы
тестовых результатов, в которой количественные данные представляются в
систематизированной и компрессионной форме, чтобы обеспечить их дальнейшую
обработку и интерпретацию.
Матрицей называется компактная форма записи множества
элементов, связанных некоторой общностью содержания [1, 157]. Формирование матрицы начинается с выбора определенного
правила для оценки ответов испытуемых на задания теста. Обычно результаты
ответов оцениваются дихотомически: а именно, за каждый правильный ответ
тестируемый получает один балл, за неправильный ответ или за пропуск задания –
ноль баллов. Если символом xij
обозначить результат выполнения i-м тестируемым j-го задания теста, то в сокращенной форме приведенное выше правило
можно записать в виде:
После выбора оценочного правила
эмпирические данные сводятся в матрицу. Строки матрицы, состоящие из единиц,
двоек, троек и четверок, соответствуют ответам испытуемых на различные задания
теста. По столбцам располагаются профили ответов испытуемых на каждое задание
теста.
В данной диссертационной работе для
статистических методов выбрана небольшая матрица, в которой зафиксированы
ответы 25 тестируемых на 40 заданий теста по чтению.
Второй
этап. Из матрицы тестовых результатов
устраняются строки и столбцы, состоящие только из нулей (двоек, троек, четырех)
или только из единиц. В нашей матрице таких столбцов и строк нет, так как все
тестируемые выбрали и правильные, и неправильные ответы.
Третий
этап связан с подсчетом
индивидуальных баллов тестируемых и количеством правильных ответов на каждое
задание теста. Индивидуальный балл тестируемого получается суммированием всех
единиц, полученных им за правильные выполненные задания теста. Полученные
результаты в ходе тестирования продемонстрированы в диаграмме
(см. Рисунок 1).
Рисунок 1 – Количества
правильных ответов
Всем известно, что корреляция задания с
критерием (rxy) является одним из статистическим требованием к
заданиям. По мнению В.С. Аванесова такое название, представляет собой
сокращенный вариант более правильного понятия – корреляция оценок, полученных
тестируемыми в задании, с оценками, полученными ими же по кому-либо критерию,
например, по сумме баллов. Корреляция определяет меру дифференцирующей
способности задания. Чем выше значения rxy, тем больше вероятность
превращения задания в тестовой форме в тестовое задание. Получаем
корреляционный коэффициент каждого задания с помощью программы Exсel.
Результаты корреляционного коэффициента
представлены в рисунке 2.
.
Рисунок 2 – Корреляционный
коэффициенты
По итогам тестировании соответствие
требованиям валидности только 45% единиц, т.е. только 18 из апробированных 40
тестовых заданий преодолели необходимый порог корреляционного коэффициента rxy
– 0.400 и получили квалификацию тестовых заданий. Представлена дифференцированная
оценка валидности тестовых заданий в виде возрастающей шкалы от нижнего корреляционного коэффициента
-0,01125 до высшего корреляционного коэффициента 0,633691.
Интерес к исследованию проблемы разработки
тестовых заданий по чтению вызван тем, что в процессе тестирования проверяется
степень сформированности коммуникативной компетенции иностранных граждан в
соответствии с уровнями общего владения казахским языком как иностранным.
В результате проведенного анализа
математических методов и процедур из 40 тестовых заданий валидными оказались
только 18, которые дали возможность сделать вывод о том, что при разработке
тестовых заданий их валидность можно определить только после первичной
апробации, несмотря на учет всех критериев селекции.
Применение on-line тестирования в данном
исследовании оказалось более приемлемым и эффективным по сравнению с другими
тестовыми системами.
Как показал опыт on-line тестирования,
бесспорным преимуществом тестов перед нетестовыми формами контроля является его
практичность, которая проявляется в:
– экономии аудиторного времени и времени
работы преподавателя в особенности при проведении тестирования в on-line
режиме;
– уменьшении времени, отводимого на
проверку ответных листов (если при традиционном письменном тестировании могли
использоваться специальные трафареты, то при on-line тестировании применяются
новые компьютерные программы);
– стандартизации и ускорении самой
процедуры тестирования, сопровождающейся повышением репрезентативности его
результатов и возможностью применения статистического
анализа результатов языковых тестов;
– изменении отношения тестируемых к
on-line тестированию, которое вызывает большую степень доверия, т.к. исключает
влияние субъективных моментов при проведении и оценке результатов;
– повышении качества тестовых заданий
благодаря их предварительной многократной проверке;
– удобстве массового on-line тестирования
и др.
Литература:
1.
Аванесов В.С. Композиция
тестовых заданий: Учебная книга. – М.: Центр тестирования, 2002. – 240 с.
2.
Челышкова М.Б. Теория и
практика конструирования педагогических тестов: Учебное пособие. – М.: Логос,
2002. – 423 с.