О графике с результатами
Мы постарались сделать так, чтобы вклад одного респондента в общий результат был равным для всех респондентов. Например, если один респондент был опрошен 5 раз, а второй — всего 1, мы добиваемся того, чтобы результаты первого респондента имели равный вес с результатами второго. Для этого была введена концепция множителей, которые уменьшают эффект от одного конкретного эксперимента настолько, чтобы количество экспериментов не влияло на общее распределение. Если текущий фильтр отсекает лишь часть результатов одного респондента, мы не увеличиваем множители его оставшихся результатов, чтобы показать, что результаты опроса этого человека представлены сейчас не полностью.
Полтора землекопа
Многие, наверно, помнят о неправильно решённых задачках, в которых количество людей получается дробным. Так вот, в нашей системе такие результаты не являются ошибкой. Дробные результаты появляются тогда, когда выбрано несколько разных экспериментов, в которых один и тот же человек мог дать разный ответ. К этим случаям могут относиться как проявления вариативности в речи одного говорящего, так и просто наличие разных слов или методов.
Расчёты
Множитель для данного респондента и слова высчитывается, как единица, делённая на сумму всех строчек с этим респондентом и словом.
Допустим, у нас есть следующее распределение результатов, для которых мы посчитали множитель mul:
rsp | mtd | word | res | mul |
---|---|---|---|---|
1 | Чтение | тест | э | 1/3 |
1 | Чтение | тест | э | 1/3 |
1 | Вопрос | тест | е | 1/3 |
2 | Чтение | тест | э | 1/4 |
2 | Вопрос | тест | э | 1/4 |
2 | Вопрос | тест | э | 1/4 |
2 | Вопрос | тест | е | 1/4 |
Посчитав сумму множителей для каждого результата и разделив её на общую сумму множителей (равную 2) получим следующее распределение:
е | э |
---|---|
7/24 | 17/24 |
Чтобы найти среднее количество респондентов в нашей выборке, получивших данный результат, умножим полученные доли на количество респондентов, равное 2:
е | э |
---|---|
0,6 | 1,4 |
Можно заметить, что нам пришлось произвести две взаимообратных операции, которые перестанут быть таковыми при отсеивании некоторых строк из таблицы. Это произойдёт потому, что множители согласно нашей системе останутся прежними (см. выше), а их сумма изменится.
Такая ситуация может появиться, если мы, например, выберем только метод "Вопрос":
rsp | mtd | word | res | mul |
---|---|---|---|---|
1 | Вопрос | тест | е | 1/3 |
2 | Вопрос | тест | э | 1/4 |
2 | Вопрос | тест | э | 1/4 |
2 | Вопрос | тест | е | 1/4 |
Количество респондентов по-прежнему равно 2, а сумма множителей изменилась и стала равной 13/12.
Произведя аналогичные операции, получим:
е | э |
---|---|
7/13 (1,1) | 6/13 (0,9) |
При таком количестве респондентов корреляционная зависимость сводится к нулю, но при наличии большой выборки она становится гораздо более ощутимой.