| Стaтья: Калькулятор ПР. |
Roku
"Робеспьер"
Сообщений: 5/2
|
Автора: Полозов Ярослав Викторович, Неганов Юрий Иванович, Рыбак Александр Владиславович. Описание программы: Программа позволяет установить точность типирования соционика на основании его субъективно введенных ним данных точности типирования по каждому признаку Рейнина. В частности, программа может быть использована как калькулятор ПР. Главная цель программы – иллюстрация очевидных преимуществ использования ПР, повышения точности типирования, выработка объективной самооценки типировщика к процессу типирования. Ключевые слова: Признаки Рейнина, типирование, точное типирование, соционика, паскаль, калькулятор признаков Рейнина
Зачем нужен калькулятор ПР? Допустим Вы владеете базисом Юнга и вам известно с какой точностью Вы типируете эти дихотомии. Оценить свою работу в этом случае очень просто: просто перемножить точности типирования разных дихотомий. Если вы владеете еще какой нибудь, 5-й дихотомией, то тут – тоже просто: вырать наилучший базис типирования в соответсвие с каждым случаем, где та или иная дихотомия лучше выражена. Совсем иначе обстоят дела, когда число дихотомий, которыми владеет типировщик больше или равно 6. Тогда появляются рассуждения типа: Так я заметил что мне удается типировать статику-динамику 98% точностью. Вообщем, анилизируя свои ошибки, я обнаружил что вот уже 2 года подряд - не делаю ни единой ошибки по данной полярности, кроем того, за это время мое типирование заметно уличшилось. Вес-Серь 93%, Расс- Реш 95%, Иррац - Рац 90%. Все это есть мое субъективное мнение о себе. Высокая точность данных шкал - позволяет мне на них положиться, но вообщем, они дают точность при умножение только 79%. Но поимимо этого есть еще и другие коректирующие шкалы, посрдством которых мне удется типирование: Интуция - сенс 90%, Логика-Этика 75%, Экстра-интро 70% Даже если я и ошибусь я могу как-то исправить ошибку на основание преобладания иных дихотомий. Какова же в таком случае моя точность типирования? Именно для решения таких задач был разработан калькулятор ПР.
Базовые понятия:
Допущение о том что ИСТИННЫЙ ТИМ «Х» называется архигипотезой. За нее в алгоритме отвечает переменная timi: byte; {номер исходного ТИМа }
Комбинация Рейнинских дихотомий называется гипотезой. Всего гипотез возможно 32768. За нее в алгоритме отвечает переменная mask: word;{дихотомийная характеристика полученного результата типирования}
Допущения рассматриваемые в пределах гипотезы о том что типируемый относится к ТИМу 1..16 называется микрогипотезами. При этом каждой микрогипотезе присваивается вероятность путем перемножения данных введенных социоником о точности типирования той или иной дихотомии, и записывается в виде переменной для дальнейшей обработки. За нее в алгоритме отвечает переменная kora: array1..16 of real; {массив микрогипотез} Также есть такое специфическое понятие как наиболее вероятная микоргипотеза в соответсвие с гипотезой. За нее отвечает переменная otipiroval: byte
Вероятностью точного типирования называется сумма вероятностей выпадения всех гипотез что благоприятсвуют правильному результату(точному типированию). Главной задачей калькулятора ПР является обеспечить подсчет всех результатов которые обесечивали бы правильный вывод типирования. Поскольку комбинаций возможно 32768, кроме того – многие из них противоречивы и требуют сравнения с многими другими версиями был разработан специально алгоритм который позолял бы облегчить выполнение данной задачи.
Правильных результатов всего возможно 16, поэтому необходимо сделать 16 архигипотез(здесь специально используется приставка «Архи» поскольку эти гипотезы не имеют никакого отношения к гипотезам описанным выше) затем перебрать все 32768 гипотез в пределах каждой из архигипотез, из которых необходимо суммировать вероятности выпедения всех гипотез в пользу ИСТИННОГО ТИМа. Вероятности выпадения гипотез получаются путем перемножения вероятностей выпадения данных дихотомий, сравнивая набор дихотомий гипотезы с набором дихотомий архигипотезы, присваивая каждой дихотомии значение «ИСТИНА» или «ЛОЖЬ»
Значению «ИСТИНА» присваивается вероятность равная вероятности точного типирования данной дихотомии вводимая типировщиком. Предполагается ввод точности типирования в диапазоне 0, 5..1. Значению «ЛОЖЬ» присваивается вероятность, равная «1-вероятность точного типирования данной дихотомии». Производится перемножение вероятностей и суммирование их в категорию одного из 16 (17, если учитывается вариант «ТИМ не определен»)ТИМов, в зависимости от того к какому ТИМу выберет типировщик данную комбинацию дихотомий. Сума вероятностей выпадения всех таких гипотез постоянна и равна 1. Выбор наиболее вероятного ТИМа. В соответвие с каждой из гипотез проводится выбор наиболее вероятного ТИМа. Для выбора наиболее вероятного ТИМа делатеся 16 микрогипотез – перебор 16 ТИМов и оценка их вероятности путем перемножения по принципу, описанному выше. Затем делатеся выбор микрогипотезы, что набрала наибольшее значение. Данный выбор есть оптимальным. Доказательство читайте дальше в статье.
Начало: Программа задает вопрос об используемых дихотомий типировщиком, а также о вероятности их определения, которые задает типировщик задает субъективно.
(1)Программа формирует категории версий типов(гипотезы) Программа выстраивает все возможные двоичные коды обозначающие дихотомии.(это есть число 2 в степени Н, где Н – число используемых признаков. Максимальное число таких кодов = 3276 Причем, для бита имеющего значение 1 соответсвует значение ИСТИНА, для бита, имеющего значение 0 соответсвует значение ЛОЖЬ. Например номер версии социтип «Дон Кихот» в данном случае будет иметь код 111111111111111= 32767.
Методы выбора близжайшего ТИМа, в соответсвие с введенной вероятностью точности типирования дихотомий(выбор лучшей из микрогипотез). Есть разные методы выбора ТИМа, в соответсвие с точностью типрования применительно к каждому набору дихотомий. Вот расскажу про некоторые из них: Особенностью дихотомийных кодов есть то что их типировщик типирует с неодинаковой вероятностью. Если бы вероятность была бы одинаковой то можно было бы просто применить алгоритм выбора версии, близжайшей по кодовому расстоянию. Алгоритм должен учитывать тажке такие дихотомии которыми типировщик не владеет(т. е.: 50%). Заданная формула подсчета должна такими дихотомиями пренебрегать. Чем выше точность типирования некоторой дихотомии тем выше должнен быть ее вес при поиске наиболее подходящей версии. Из этой формулировки следует что формула должна иметь в себе корень: Если признак увиден таки как у «Дон Кихота» kora:=kora +(1-tochnostj ) Не таким как у «Дон Кихота» else kora := kora + (tochnostj ); Где і - номер рассматриваемого ТИМа, j – номер дихотомии. Если предположим вероятность точного определения дихотомии составляет 50%(не владеет типировщик) то в первом случае, когда кодовое искажение есть - типировщик прибавляет к кодовому расстоянию 0.5, во втором случае когда кодового искажения нет – типировщик прибавляет к кодовому расстоянию тоже 0.5. Получилось, что противоположные версии по данной дихотомии - равны. И наоборот: если точность типирования данной дихотомии составляет 100% то в пользу данной версии то в пользу данной версии цикл прибавит кодовое расстояние 0, а в пользу противоположной 1. Таким образом получается очень существенна разница в ходе опрации сравнения.
Данный метод, который был предложен впервые имел недостаток: например при введение базиса Юнга с точностью 100%(отсюда должно следовать такое равенство что точность типирования должна составлять ровно 100%, независимо от введенных точности типирования иных дихотомий) и при введение точности типирования других дихотомий, скажем 70% получалось что общая точность снизилась на 8, 5%. В то время когда: «Если точность типирования некоторой дихотомии 100% - это значит что не может быть дихотомий(одной, или комбинации нескольких) которые могли бы перевесить версию типирования по данной дихотомии» Это подтолкнуло на необходимость поиска иного метода подсчета веса типирования дихотомий. Рассуждения следующие: Из написанного выше по поводу точности типрования следует что по мере достижения точности типирования 100% вес дихотомии стремится в бесконечность, и вся категория версий типов которые оттипированны правильно с точки зрения этой дихотомии должна иметь максимально возможный вес, а версии, что противоречат данной дихотомии – не могут существовать. Пример: Если превосходство значительно то вы присваеваете вывод о ТИМе типируемого. Если незначительно то Вы считаете что ТИМ – не определен. Представте себе ситуацию, когда перед Вами в пользу версии «А» указывает дихотомия «а», а в пользу версии «Б» указывает дихотомия «б» в каком случае это превосходство значительно? Какие выводы зделаю я: а и б: 0, 55 и 0, 65 «ничтожно» 0, 65 и 0, 75 «незначительно» 0, 75 и 0, 85 «близко» 0, 85 и 0, 95 «скорее всего этот типируемый отностится к ТИМу «Б»». б=100% - «данный типируемый есть ТИМ «Б»(категорией ТИМов, которым характерна дихотомия «б»), все остальное не имеет значения» Для этого примера были взяты равные интервалы в 10% но отличие в оценках сравнения оказалось очень существенным.
Метод «Выбор наиболее вероятной версии» Примечание к алгоритму: Особенности работы Паскаля таковы что программе легче делать операции сравнения уже с готовыми константами, обозначающими набор дихотомий для каждого ТИМа. Поэтому мы зделали еще дополнительную программу, которая зделала бы подсчет констант в соответсвие с комбинацией дихотомийных признаков для каждого ТИМа. Для этого разработано вспомогательный алгоритм в файле: Constan.txt Вывод констант в файле: CONST.txt
Сначала в соответсвие с каждой гипотезой wvid формируется 16 микрогипотез kora, где wtim – набор дихотомий в соответсвие с каждым ТИМов, представленным в виде десятичного числа, kisk – кодовое искажение: переменная что фиксирует все насовпавщие дихотомии в соответсвие с i-й. Формируются вероятности выпадения микрогипотез kora.
for i:=1 to 16 do begin kisk:=wvid xor wtim ; kora :=c; for j:=1 to 15 do if (kisk and (1 shl (j-1))=0) then kora :=kora *tochnostj else kora := kora *(1 - tochnostj ); end; Здесь «с» – просто коефициент, множитель, тот же самый, что используется при выводе таблицы, ради того чтобы не было перед глазами слишком большого числа нулей. Он равен 1000000. Здесь же используется только для того чтобы при вводе константы «квант превосходства» не иметь дело с большим числом знаков после запятой, поскольку при данном методе кодовые различия вероятности в пользу той или иной дихотомии представляют собой – ничтожно малые величины. После чего производится 16 сравнений и делается выбор микрогипотезы что набрала найвышую оценку: {Поиск tim с максимальной вероятностью определения} otipiroval:=1; for i:=2 to 16 do if (kora koraotipiroval ) then otipiroval:=i; А также проверкой на поворяемость на тот случай, если превосходство версии в вероянтсти типирования не велико или есть еще такая же вероянтая. koraz:=0; {число повторений перед подсчётом обнулим} for i:=1 to 16 do if (abs(koratim -kora )=pre) then Inc(koraz); Такие результаты классифицируются в категорию «ТИМ не определен» if (koraz 1) then otipiroval:=17; {Чебурашка}
После чего делается подсчет вероятности появления данной гипотезы: kisk:=wtimtimi xor wvid; p:=c; for i:=1 to 15 do begin if (kisk and (1 shl (i-1))=0) then p:=p*tochnost {нет искажения признака} else p:=p*(1-tochnost ); {есть искажение признака} end; {теперь p=вероятность появления комбинации kisk, при условии что на входе был ТИМ с номером timi, tim - обнаруженный ТИМ; если tim=timi, то типирование верно}
И суммируется вероятность в категорию, которая выбрана в соответсвие с наиболее вероянтой микрогипотезой в соответсвие с гипотезой: versiotimi tim :=versiotimi tim +p; далее делается перебор всех возможных гипотез, повторяя весь цикл, в итоге получая распределение вероятности точного типирования и ошибок по каждому ТИМу в соответсвеи с заданной точностью.
Данный алгоритм учитывает дихотомии, которыми типировщик не владеет, т. е: обе версии в пределах данной дихотомии – домножит на одинаковое число, что не даст никакой разницы на этапе сравнения. Примечательно что этот алгоритм может «уступить» большому числу дихотомий, точность типирования которых – не велика(но их получилось большинство), но в то же время может обнулить версии, что противоречат дихотомие 100%, и тогда уже никакие дихотомии не смогут этого «опровернуть». Пример. Рассмотрим на уровне 3 базисных дихотомий и 4 добавочных. Кодовое расстояние в этом случае между каждым близжайшим ТИМом равно 4 т. е: любой ТИМ от любого ТИМа в этом случае отличался бы на 4 дихотомии. Допустим произошла однократная ошибка в дихотомии, точность которой «высокая», а против нее выступают 3 дихотомии с «посредственной» точностью. Остальные – «нейтральны» т. е: такие что характерны для обоих ТИМов. Д1=0, 9 Д2=0, 7 Д3=0, 7 Д4=0, 7 Что зделает алгоритм: В1=Д1*(неД2)*(неД3)*(неД4) В2=(неД1)*Д2*Д3*Д4 В1=0, 9*0, 3*0, 3*0, 3=0, 0243 В2=0, 1*0, 7*0, 7*0, 7=0, 0343 Вывод: вероятнее всего данный ТИМ = «В2» Однако, если точность типирования Д1 будет 0, 95 То тогда: В1=0, 02565 В2=0, 01715 Таким образом, одну дихотомию 0, 9 могут перевесить 3 дихотомии по 0, 7, а вот дихотомию 0, 95 уже нет. Именно так реагирует предложенный мною алгоритм выбора наиболее близкой версии. Перевернем задачу(последнею рассмотренную): допустим что на самом деле это и был ТИМ «В1», тогда произведение вероятностей указывает на появление данной комбинации дихотомий, соответсвующей ТИМу «В1» и полученые при нем комбинации дихотомий есть примерно в 1, 5 раза более вероятными чем получить противоположные комбинации(для случая в В2). Все это указывает на то что алгоритм работает успешно. Более того эта задача иллюстирует еще один успешный шаг в использовниие ПР: Дихотомии, точность типирования которых не велика, но в большом количестве, полученные согласовано могут повысить точность типирования и даже перевесить дихотомии с высокой точностью типирования. В дальнейшем данное утвердение будет использовано мною как теорема. Алгоритм находится в файле: Min.txt
Калькулятор ПР(Метод, составленный командой Михаила Морозова) Я не вникал особо в тонкости алгоритма, но уже на этапе тестировки замечены грубые ошибки, которых не имеет мой алгоритм: 1) При введение точности типирования некоторой дихотомии 100%, а других, скажем по 75% появлялись версии, противоречащие данной дихотомии, точность которой определена как 100%. Иными словами нечто(в своей совокупности), известное как такое, где ошибка в определение может существовать может перевесить в некоторых случаях то, что определено как истина в последней инстанции. 2) В часнтости, при вводе точности типирования некоторой дихотомии 100% и вводе некоторой комбинации дихотомий меньше 100% появлялись версии, наиболее вероятныие из которых – противоречила дихотомие, точность определения которой было оценено как 100%. 3) При введение базиса Юнга(согласовано, для простоты: в пользу Дон Кихота) все по 75% получалась в итоге точность определения 31, 6%. Однако, при введение дополнительных иных дихотомий с такой же точностью, точность – не росла, а только изминялась структура распределения альтернативных версий. Алгоритм по сути показывал бесполезность использования иных признаков Рейнина. А это неправильно. 4) Учет дихотомий, точность определения которых составляла 50% вел к понижению точности типирования, в то время, когда должен не понижать точность типирования. 5) Градация точности определения дихотомий не удобна: 1 деление соотвествует 56%, 2 – 62, 5%, 3 – 75%, 4 – 100%. В то время, когда чем ближе приближается точность опредления дихотомии к 100% - тем больше больше «ощутим» каждый % такого приближения. Все это указывает на никудышнею работу при составление программы выбора наиболее вероятного ТИМа.
Калькулятор ПР, составленный моей командой. Тот предложенный способ под названием метод «Умножения точностей» может быть довольно сложным для определения ТИМа особенно для случаев с тому подобными особенностями, как это описано в примере. Поэтому на базе данного алгоритма был составлен калькулятор ПР, который позволили бы делать выбор сам, на базе введенных показателей дихотомий. Особенность ввода данных: За основу счета были взяты дихотомии «Такие как у Дон Кихота». Если признак «Такой как у Дон Кихота» то вводится ваша самооценка точности типирования. Если признак не такой как у Дон Кихота – вводите «1-точность». Использование калькулятора ПР в полевых условиях типирования. Часто бывает так что не все признаки Рейнина которыми владеет типировщик удается зафиксировать, или сам процесс типирования не соотвтествовал некоторым требованиям типировщика. Тогда даже самые точные дихтомии, которыми владеет типировщик не могут быть оценены как такие что оттипированы с высокой точностью. Разумеется что для данного конкретного случая типирования точность ниже, и для таких вот случаев разработан калькулятор.
Самооценка собственной точности типирования. Для вывода общей самооценки(глобально) следует брать максимально возможную точность типирования. Оценка же отдельного случая типировния может быть и меньше чем глобальная оценка т. е: в отдельных случах может так получится что типировщик неодостаточно уверен даже по той дихотомии которую он знает очень хорошо.
Поэтому в отдельных случаях оценка типирования может быть ниже чем та что задекларировал соционик в общем случае. Для этих случаев разработан Калькулятор ПР. Алгоритм самооценки Калькулятор находится в файле: Calc.txt.
Алгоритмы «пропорциональной подгонки к единице»
Обычно социоников интересует % точного типирования и % ошибок. В случаях же, когда соционик неопределен с результатами типирования – он просто повторяет работу до тех пор пока пока некотороя версия не наберет очевидного(на взгляд соционика) превосходства. Какой алгоритм следует написать для данной категории социоников? Первое что пришло в голову – это разбросать равномерно всех «чебурашек» по всем весриям. Но тут: Стоп!. А что если эти версии противоречат дихтомиям точность определения которого определяются социоником как 100%? Получается абсурд. Второе что пришло в голову: увеличить все оставшиеся версии на некоторый коефициент, так чтобы сумма всех версий в конечном итоге она давала 1 т. е: охватывала полную группу событий. Эти две гипотезы породили алгоритм обеспечивает реализацию вышеупомянутых задач:
Безчебурашный алгоритм. Именно эту модель поведения имитирует тело алгоритма:
If versio1, 17 c then For I:=1 to 16 do Versio1, I :=c*versio1, I /(c-versio1, 17 ) Else for I:=1 to 16 do Versio1, I :=c/16; Versio1, 17 :=0;
Такой аглоритм позволяет сопоставить разные в точности диагностики, привев их к всего к 2 величинам соотношения: % ошибок в первом случае и % ошибок во втором. Такой подход позволяет упростить сопоставление точности типирования когда есть например соционик что типирует с 72% точностью и 28% ошибками и соционик что типирует с 50% точностью, 48% чебурашек, 2% ошибок. В итоге получилось, что второй соционик типирует с точностью 96%, вероятность ошибки составляет 4%. Это иллюстрирует очевидные преимущества второго соционика на первым. Практика использования данного алгоритма показала высокую эффективность и простоту при сопоставление одних методик с другими. Алгортим находится в файле: CalcNoCh.txt Лучше воздержатся чем оттипировать неправильно. Как уже говорилось: в случае получения неопределенной версии типировщик будет типировать до тех пор пока версия не наберет некоторого заметного превосходства. Поскольку вероятность получить согласованно истинный вариант выше вероятности согласовано ошибиться то такое правило обеспечивает повышение точности даже на уровне использования 5 дихотомий (файл 5dih75.txt)
Гюго и Дюма не существует! Если типировщик твердо убежден что некоторых ТИМов не существует то к величине «Чеб» следует прибавить значения которые выдаст алгоритм, и использовать формулу Выше. Для случая с 0 имеет значение теперь уже величина «ТИМы+Чеб». Аналогично, в случае с делением на 0 ТИМы просто пропорционально разбрасываются. Эта величина одинакова для каждого ТИМа и равна 0, 0625 в случае с делением на ноль.
If (versio1, 17 +versio1, 2 +versio1, 3 c) then
For I:=1 to 16 do Versio1, I :=versio1, I /(c-versio1, 17 -versio1, 2 -versio1, 3 ) Else For I:=1 to 16 do Versio1, I :=c/14;{В итоге получается что ТИМов в природе не 16 а только 14}
Versio1, 17 :=0; versio1, 2 :=0; versio1, 3 :=0;
Случаи с убеждением типировщика о том что некоторых ТИМов не существует – очень специфичны, поэтому для них разрабатывать универасльный алгоритм охватывающий любые их особенности считаю нецелесообразным. Если такие найдутся – путь используют выше описанный пример и пишут программу под себя.
Квант превосходства Этот фрагмент статьи посвящен поиску некоторой величины котороя отображает уровень достаточного превосходства выбранной версии в пользу некоторой, ниже которой ТИМ следует считать неопределенным. Чисто эмпирическая величина, которую следует подгонять индивидуально под каждого типировщика.
Задача на применение алгоритма, иллюстрирующая преимущества использование ПР. Пусть есть 3 основные дихотомии на основание которых может существовать до 8 типов. Вероятность точного определения любой из дихотомий составляет 0, 9. Если бы были использвоны только 3 основные дихтомии то вероятность точного типирования составляла бы 0, 729. Для удобства сопоставления результатов произведем подсчет, подобно тому как это делает алгоритм Calc2008.txt
На основание этих 3 основных дихтомий можно составить еще 4 контрольные(добавочные) по аналогие с тем как их ввел Рейнин. Итак, вот комбинации дихотомий типов: 1 2 3 4 5 6 7 1 + + + + + + + 2 + + - + - - - 3 + - + - + - - 4 + - - - - + + 5 - + + - - + - 6 - + - - + - + 7 - - + + - - + 8 - - - + + + - Где 1, 2, 3 – основные дихтомии 4, 5, 6, 7 – контрольные, где: 4=1*2 5=1*3 6=2*3 7=1*2*3 по горизонтали: номер дихтомии по вертикали: номер типа. Допустим, что их вероятность точного определения точного определения контрольных дихтомий составляет тоже 0, 9. Допустим что истинный тип – это тип номер 1. При таком способе образования дихотомий любой тип будет отличатся от любого другого на 4 дихтомии т. е: кодовое расстояние = 4, что можно проследить уже на примере 1 типа. Если все дихтомии определены безошибочно, то в этом случае будет получен код типа 1, и тип будет определен точно. Если будет произведена однократная ошибка то получиться следующая картина: разница между кодом первого типа будет равна 1, между любыми другими будет разница 3 и тип, который будет в итоге присвое как наиболее вероятный – первый, так что ошибка тоже будет исправлена. Всего таких комбинаций = 7 Вероятность появления комбинации дихотомий без ошибки = 0, 478 Вероятность появления комбинаций дихотомий с однократной ошибкой = 0, 053 Итого вероятность правильного типирования = 0, 478 + 7*0, 053 = 0, 85 Что уже больше чем в первом случае: 0, 729 Далее: при получение комбинации дихотомий с двухкратной ошибкой, тип классифицируется как «тип не определен» потому что обязательно найдутся такие 2 типа, кодовое расстояние к которым будет одинаковым. Число таких комбнаций= 7С2 = 21 Вероятность такого результата = 7С2*0, 9^5*0, 1^2=0, 124 Сама же вероятность ошибки в этом случае равна = 0, 026 Получилось что вероятность правильного определения ТИМа составляет 97%, а ошибки 3%. Прогресс очень существенен.
Практическая задача на применение калькулятора ПР. Часто в практике использования ПР случаются такие ситуации, когда не все найденные дихотомии указывают на единый ТИМ. Иногда получается так что некоторые (пусть даже и в меньшинсвтве по количеству и по качетсву!) указывают на иной ТИМ. Тем не менее это формирует следующие размышеления: Если ошибка в меньшинстве – значит все таки данный ТИМ – наиболее вероятен, однако это все равно не то качетсво типирования как если бы получили бы данные типа того, когда все дихотомии определены в сторону данного ТИМа. Это надо тоже учитывать!. Разобранная задача выше является прямым примером максимально возможного качества определения одного из 8 типов, когда все найденные дихотомии указывают в пользу единого ТИМа. Теперь рассмотрим работу алгоритма анлогичного работе Calc2008.txt Допустим получена комбинация + + + + + + -
Вероятность получения любой комбинации дихотомий при условие заданной точности определения дихотомий, независимо от полученного результата составляет 0, 9. Рассуджения следующие: если в коде сообщения нет ошибок. Вероятность получения данного кода составляет 0, 97 = 0, 47830 Данный код будет интерпретирован как тип1. Если в коде есть однократная ошибка, то только один вариант однократной ошибки будет интерпретирован как тип1. Остальные укажут на неопределенность результата. Вероянтость такого сообщения составляет (0, 9)6*0, 1 = 0, 05314 Интерпретирован в тип1, суммирован к типу1. Вероятность случаев с неопределенным результатом 6*(0, 9)6*0, 1 = 0, 31886 Интерпретирован в тип «неопределен», суммирован к типу «неопределен». Некоторые случаи двухкратной ошибки все равно привели бы к интерпретированию в тип1. Таких случаев возможно тоже 6. Вероятность такого случая составляет: (0, 9)5*0, 12 = 0, 00590. Всего вероятность: 6*(0, 9)5*0, 12 = 0, 03543 Прочие версии сообщений не будут интерпретированы как тип1. Допустим теперь что тип1 и есть истинный тип. Тогда, вероятность точного типирования составляет 0, 47830 + 0, 05314 + 0, 03543 = 0, 56574 Вероятность неопределенного результата составляет 0, 31886 Вероянтость ошибки составляет 1 – 0, 31886 – 0, 56574 = 0, 11540 Поскольку, вероятность непределенного результата не учитывается, то Вероятность точного типирования: 0, 56574/(1-0, 31886) = 0, 83058 ( 83, 06% ) Как видим, этот результат хуже, чем в предыдущем случае, но лучше чем, если бы использовались бы только основные 3 дихотомии для передачи информации о типе. В зависимости от того, какая вероятность точного типирования будет признана между социониками достаточной – на основание таких данных принимается решение: относить данного типируемого к данному ТИМу или признавать что пока что ТИМ – не определен, до тех пор, пока не будет получена информация, более контрасно указывающеая на принадлежность к тому или иному ТИМу.
Допустим, что это тип2. + + + + + + - Относительно, данной гипотезы 3 дихотомии противоречат данному сообщению
+ + + + + + -
+ + - + - - -
1 2 3 4 5 6 7 1 + + + + + + + 2 + + - + - - - 3 + - + - + - - 4 + - - - - + + 5 - + + - - + - 6 - + - - + - + 7 - - + + - - + 8 - - - + + + -
Аналогичным образом алгоритм осуществляет подсчет вероятности выпадения всех гипотез, суммируя их в соответствие с каждой гипотезой в категорию наиболее вероятных микрогипотез. Точным типированием алгоритм признает только те версии, что соответсвуют архигипотезе, а вероятностью точного типирования сумма версий в тех случаях, когда наиболее вероянтая микрогипотеза в соответсвие с гипотезой соответсвует архигипотезе. Все остальные наиболее вероятные микрогипотезы классифицируются как ошибочные.
Поскольку истинных результатов возможно 16 алгоритм перебирает 16 архигипотез, в соотвтетствие с каждой из которых 1 из 16 ТИМов есть истинный. Александр Рыбак оптимизировал алгоритм, зделав подсчет только отностиельно одного ТИМа истинного, но при этом все равно на экран выводится таблица. Сама же таблица формируется за счет хитрого преобразования строки в таблицу, без потери в точности, благодаря особой симметрии признаков. {Построение таблицы усл. вероятностей (versio) по первой строчке.} for i:=2 to 16 do begin for j:=1 to 16 do begin wtimk:=wtim1 xor wtim xor wtimj ; {wtimk так относится к wtim, как wtim[1 - к wtim[j, поэтому versio [k =version[1 [j.} {Теперь по wtimk ищем k.} for tim:=1 to 16 do if (wtim[tim =wtimk) then k:=tim; versio [k :=versio[1 [j ; end; versio [17 :=versio[1 [17 ; {Чебурашки - везде чебурашки!} end;
Подсчет констант, и тело алгоритма – сделано на отдельной странице. Алгоритм общей оценки точности типирования типировщика находится в файле: Min.txt
Выводы: 1) Владея базисом Юнга с точностью 85% мы получим точность типирования 52%. Вероятность ошибки: 42%. В ходе первого же типирования есть недостаток того что не можем вообще судить о том правильно ли оттипировали или ошиблись. И самое главное: где? Владея Базисом Юнга на 85% и дихотомией, ортогональной всему базису: Квестимность-Деклатимность на 85% получим результат общей точности: 44% ошибки: 14%, «Чебурашки» 41%. «Чебурашками» называется неопределенный результат типирования. Если Выпадает «Чебурашка» то типировщик – страхует себя от ошибки типирования. А сам вывод «Чеб» указывает на необходимость доотипирования неокоторого типируемого, чего не имеет типировщик в случае типирования ограничиваясь Юнговским базисом. Кроме того введения всего лишь одной шкалы «Квестимность-Деклатимность» уже позволила понизить вероятность ошибки почти в 3 раза(!!!). 2) Можно и не добиватся высокой точности типирования всех дихотомий, если среди них найдется некий базис, который обеспечит максимальную точность типирования.(!)
3) В частности, если точность по каждому из 15 признаков равна 0.85, то результирующая точность правильного типирования ТИМа 0.858237, то есть незначительно больше точности по каждому признаку, зато ошибочно оттипированным получается только примерно каждый сорок пятый (вероятность 0.02205.
4) Лучше воздержатся чем оттипировать неправильно.
5) Владея большим количеством дихотомий(чтобы образовывали как минимум 8 базисов) и с высокой точностью определения(больше 80%) освоение доплонительных дихотомий – очень незначительно повышает общую точность типирования. Единственное преимущество в данном случае сулит типировщику обучения новым дихотомиям - это повышение скорости типирования.
6) Не стоит ограничиватся типированием только Юнговского базиса начинающим соционикам, ведь способности у человека разные и разное чутье к признакам(в данном контексте – независимо от ТИМа). Вполне вероятно что найдется какой нибудь иной базис(отличный от Юнговского), которого внимание соцоника позволит улавливать лучше чем Юнговский.
7) Соционики! – Долой мифы о точном типирование. В лучшем случае Вам удасться добится точности 95%, а потому – дольше типируйте, больше сомневайтесь, ищите «подкопы» к собственным версиям опровергайте и доказывайте! Помните что типирование – дело очень ответсвенное.
Не следует пренебрегать дихотомиями, точность типирования которых не велика. В большом количестве такие дихотомии тоже могут повысить точность типирования, а также перевесить дихотомии точность типирования которых велика. Использование калькулятора ПР составленного моей командой позволит сделать правильный выбор в той или иной противоречивой ситуации.
9) Чем выше величина «Требуемое превосходство» - тем ниже вероятность ошибки, но в то же время превосходво требует значительных жертв в точности. Ищите золотую середину между величинами «Требуемое превосходство» и точностью типирования. Подумайте: нужна ли вам точность вероятность ошибки ниже чем 1/100.
10) Наш алгоритм имеет недостатки: мы его писали ради того чтобы смоделировать мое поведение при типирование. Другие же могут иметь трудности: А) На этапе субъективной оценки точности собственного определения дихотомий. Б) На этапе оценки преобладания версий. В) На этапе определения степени значимости преобладания версии: т. е: значительное или же незначительное Особое внимание обращаю социоников по поводу субъективной оценки точности типирования. Если Вы хотите определить ТИМ типируемого и введете точность Вашего типирования по 100% по противоречивым дихотомиям, то калькулятор ПР в данном случае Вам не поможет. При точности типирования 100% не может существовать набор противоречивых дихотомий у типируемого.
11) Метод использования гексадекатомий – неэффективен. Описание социотипов в лучшем случае(использование самых лучших описаний+плюс с нескольких источников) достигает 60% что не намного превосходит если бы Вы пользовались Юнговским базисом. Если же Вам удастся добится типирования на основание совокупности отдельных дихотомий в пользу некоторого ТИМа более 60% то этот вид логической избыточности позволит вам обеспечить гораздо лучший контроль качества типирования чем просто сверка с описанием.
12) Если данные самооценки точности типирования типировщика по отдельным дихотомиям – объективны, то это позволит получить объективную самооценку общей точности типирования типировщика даже БЕЗ ТИПИРОВЩИКА, точность типирования которого составляет 100%. Что уже есть очень полезным инструментом который позволит в дальнейшем повысить точность типирования социоников.
13) Калькулятор ПР – по сути и есть инструментом измирения логической избыточности типирования: чем выше точность – тем выше логическая избыточность типирования. 14) Если вы позволяете себе допускать столь нелепые ошибки типа: сначала оттипировал Дон Кихотом и потом Драйзером – это не беда! Задумайтесь над тем что Вы использовали для определения типа. Например данная пара типов обладает такими общими признаками: Статика, Конструктивизм, Тактика, Демократия, Беспечность, Уступчивость, Квестимы. Вполне возможно что на данном этапе развития ваших способностей возможно что в вашем арсенале есть дихтомии, которыми Вы типируете – очень точно. Найдите их и используйте как позитивный опыт в дальнейшем!…Или возможно у вас есть хорошие способности к овладению новых дихотомий(из вышеперечисленных)(в том смысле что может быть Вы какими-то их них не пользовались, а потому – есть смысл пересмотреть отныне границы своей зоны компетенции в сторону увеличения) 15) Калькулятор признаков Рейнина – это шаг вперед к точному типированию. Предлагаю решить проблему точного типирования с уровня сходимости вообще разложив ее до уровня сходимости в пределах отдельных дихотомий, и оценки их точности. 16) Что такое ТИМ в вашем представление? Например ТИМ – это набор Юнговских дихотомий? ТИМ – это некий виртуальный(гексадекатомия) образ? ТИМ – это Набор Рейнинских признаков? Все вышеупоманутые определения – все правильны. В зависимости от каждого этапа развития соционики будет преобладать какое –то из вышеперечисленных определений как критерий истины.
Благодарю Никитина Юрия Ивановича, Рыбака Александра за помощь конструктивную критику и программное обеспечение для создания этого алгоритма.
Источники
1. Карпенко О. Б. «Позиция эксперта» СМиПЛ N 1, 1999. 2. «Наполение Признаков Рейнина: Результаты практических исследований» СМиПЛ №1 2003 3. Рейнин Г. Р. Группа биполярных признаков в типологии Юнга. // "Соционика, ментология и психология личности", 1996, № 6.
4. Аугустинавичюте А. Теория признаков Рейнина. Очерк по соционике // "Соционика, ментология и психология личности", 1998, №1-6.
5. Полозов Я. В. Познавательная игра: представь себя Юнгом!
6. Морозов М., Прошкин И. Вероятностное типирование по признакам Рейнина // "Соционическая газета", 2003, № 14 (17).
5 Мая 2008 23:32
|
sein
"Штирлиц"
Сообщений: 9/0
|
Знакома ли Вам формула Байеса? Мне кажется, что из неё легко вывести распределение вероятностей на множестве ТИМов, соответствующее каждой из 32768 "Комбинаций Рейнинских дихотомий".
Моя ссылка на калькулятор Рейнина, работающий на основе формулы Байеса (а также статью, описывающую его алгоритм) была удалена с этого форума, но я могу прислать её в личной переписке, если Вам интересно.
6 Мая 2008 08:05
|
lesnoykot
"Жуков"
Сообщений: 86/197
|
есть закон "информационного равновесия". В данном случае Вы пытаетесь выдумать соционический "вечный двигатель".
Дело в том что сейчас нет способов ОБЬЕКТИВНО определить колическво ошибок при типировании потому что нет реальных способов проверить ТИМ. А если появится такая возможность то это и будет тот самый способ типировать правильнее и необходимость в калькуляторе отпадает.
И потом, с каждым новым типированием умение типировать УВЕЛМИЧИВАЕТСЯ, то есть все коофициенты В РЕАЛЬНОСТИ меняются динамически. Этот фактор я так понимаю невозможно учесть.
И хотя математически механизм вычислений верный, но сделаны допущения, которые уничтожают ценность этих вычислений.
6 Мая 2008 23:29
|
sein
"Штирлиц"
Сообщений: 10/0
|
lesnoykot, Вы правы: в предложенном Roku подходе действительно содержится порочный круг. Однако сама идея самокорректирующегося калькулятора Рейнина, по-моему, вполне жизнеспособна. Детали описаны в упомянутой выше статье, но вкратце идея такова.
На основе статистики прохождения теста на калькуляторе Рейнина можно проверить статистическую значимость каждого признака. В качестве примера, представьте себе ситуацию, когда из ста заполнивших тест людей восемьдесят выбрали вертность, противоречащую их наиболее вероятному (по версии калькулятора) ТИМу. Такой результат означал бы, что
- описание вертности понято неправильно большинством заполнявших, или
- вертность обладает слабой предсказательной силой, или
- само понятие вертности не описывает реального феномена.
В любом случае, такой результат позволил бы уточнить типирование путём
- уменьшения веса вертности в вычислении вероятного типа последующих типируемых, и
- уточнения понятия вертности и его описания
Такой калькулятор с обратной связью позволил бы улучшить типирование путём последовательных приближений технологии к идеалу.
7 Мая 2008 07:37
|
|