19 октября, суббота 09:50
Bankir.Ru

Объявление

Свернуть
Пока нет объявлений.

Скоринг частные лица

Свернуть
X
  • Фильтр
  • Время
  • Показать
Очистить всё
новые сообщения

  • Выступил на одной конференции студентов практикантов Б., на слайдах схематично обрисовал что такое скоринг, вроде всем понравилось, сказали что тема актуальна, единственное вроде господам не совсем приглянулись мои либеральные выводы, а впрочем, спасибо всем за ссылочки пригодились, кстати на днях обещали подкинуть образец одной скоринговой программки если кому интересно

    Комментарий


    • "CreditAnalyst - Программный комплекс на основе нейросетевых технологий и data mining, предназначенный для комплексной оценки и анализа кредитоспособности заемщиков в розничном кредитовании." - сайт компании "Бизнес Нейро-Системы" (www.bns.com.ua)

      ...скажите, кто-нибудь "держал в руках" эту программу ? Написано много, достаточно интересно, но почему-то никто ничего о ней не знает ...

      Комментарий


      • Статья, где описываются основные методы построения скоринговых моделей:

        Комментарий


        • Уважаемые коллеги! Буду признателен, если кто-то сможет сказать, имеет ли право на жизнь следующая модель разработки скоринговой системы (упрощённо):
          1. Долго думаем, рассчитываем (подбираем) весовые коэффициенты на основе своего опыта.
          2. По формуле логистической регрессии пересчитываем значения скоринга для имеющейся статистики по клиентам. При этом заёмщики одинакового качества должны получать примерно одно и то же значение с незначительным разбросом. В случае больших отклонений пересматриваем весовые коэффициенты, и снова пересчитываем.
          Если кто-то нечто подобное осуществлял, рад буду услышать комментарии.

          Огромное спасибо.

          Комментарий


          • ... так делать нельзя, т.к. при расчете отклика логистической регрессии к взвещшенной суммме применяется еще и логит функция, а при экспертной разработке скоринговой карты - нет.

            Комментарий


            • Доброго времени суток!
              Хочу опять про скоринг "физика" узнать.
              Банк импортный и взгляд на Россию, у него такой же.
              А проблема вот в чем. Для скоринга я использую методику FICO ( вернее пытаюсь использовать) , понятно что для России эта метода не пригодна, у меня нет столько данных по кредитной истории заемщика. Метода Дойчбанка тоже не лишена изьянов, в России отсутвует прямая зависимоть между получаемой з.п. заемщика уплаченными налогами.
              Вопрос в следующем ,может кто знает как Сбер. работает (как скорит) или на худой случай ВТБ.

              Комментарий


              • А как насчет использования в скоринговой модели по физикам деревьев классификации? Меня этот метод заинтересовал, но скоринг у меня впервые. Какими факторами классификации можно поиграться в модели. Подскажите, плиз...

                Комментарий


                • Гусар вам замечание. Два однотипных поста в разных темах. Внимательно прочитайте Правила.

                  Комментарий


                  • Гусар !
                    Деревья классификации - это один из самых эффективных методов по скорингу. "Играть" надо до построения самой расчетной схемы по скорингу - есть такое понятие "разведочный анализ данных" - это типа "мойте руки перед едой" (пенициллин в аптеках есть еще, но руки лучше вымыть). Суть этого этапа - отбор значимых предикторов. Чем хороши методы типа деревьев - мона не только балльные данные туда "загонять", но и категоризированные (типа "не был", был", привлекался", "не имел" и т.д.). Но опять таки - сначала надо с исходным материалом поработать, иначе, ежели "загрузить" в метод тонну зерна и тонну опилок - на выходе неликвид будет и разочарование полное.
                    Еще одна тема - это сравнительный анализ деревьев и нейросетей. Пока выводы неустойчивые - еще месяц два буду тестировать. А потом - усе готово, тока исходные данные давайте и, договоримся....

                    Комментарий


                    • Risk
                      основанный на классификационных деревьях есть методика анализа и различения предприятий банкротов (Альтман, Фридман). В краткой версии описан в книге Синки "Управление финансами в коммерческом банке". В этой методике только финансовые коэффициенты. По-моему вплоне разумная методика.
                      А что Вы о ней можете сказать?

                      Комментарий


                      • ЕленаПрекрасная ! К сожалению (или к счастью) я занимаюсь физиками и именно этот скоринг мне ближе всего в данный период. Поэтому не могу судить в данный момент о юриках. В свое время по мотивам Синки, потратив неделю или две, мы сделали (попробовали) сделать ее (методику) в Excel - и очень успешно применяли на стадии первичных переговоров. Сейчас по-моему в каждом банке есть что-то свое, причем даже в разрезе разных типов юриков (страховые, торговля и т.д., не говоря уже о ПБЮЛ).
                        Методика вполне разумна. Но почему только финансовые коэффициенты? Из-за того, что они в отчетности есть? Вот например один из свежих факторов отказа нашим департаментом риска по заемщику - большие вложения в новый вид бизнеса, в котором менеджмент заемщика никогда не работал. Из коэффициентов не вытекает, в какой бизнес идут вложения - в освоенный и устойчивый или в "новый и неведомый" (все в рублях и все), а фактор - самый серьезный. По финсостоянию текущему за 2 последние отчетные даты - все в ажуре!
                        Вообще в финансовых книжках излагаются уже законченные, построенные модели и схемы. А сам метод не рассматривается.

                        Комментарий


                        • Risk

                          А как вы считаете скоринг модель можно построить используя, спец. программы или не только и что конкретно можно почитать по построение этих моделей?

                          Комментарий


                          • Risk
                            "скромность" зарубежных авторов объясняется, конечно, рынком - книгу надо написать так, чтобы все восхитились твоей эрудицией, но в то же время не смогли воспользоваться результатами твоей работы, а обратились к тебе за (платной, разумеется) консультацией. Это правда. Безусловно, объективные системы оценки кредитного риска необходимо комбинировать с субъективными - экспертными или балльными оценками. Не могли бы Вы поделиться опытом скоринга физ.лиц - как это делается? какие показатели в методике? какие из них ключевые? (страхование жизни, наличие недвижимости, стабильность зарплаты ....)

                            Комментарий


                            • Морковкин Артем ! Конечно спец. программное обеспечение. Самому велосипед изобретать можно, но зачем?
                              А почитать из текущего - Банковские технологии №5 за этот год. Там есть статья про разработку скоринговых систем. Общая теория - сейчас мало изданий на эту тему в стране - все издавалось, в основном, до 1989 (хотя деревья решений - "родом" из 1984 г.Breiman et al. (1984)). По нейросетям - литературы сейчас немало, включая самоорганизующиеся карты Кохонена. В принципе, теории (строгой математической) нейросетей нет, так - общие подходы и частные конструкции и соображения. Постоить скоринговую систему можно и в Excel, если знать как. Ведь можно это сделать даже средствами Excel: "просеить" предикторы (пункты анкеты и др. документов) и сформировать дискриминантную функцию.
                              ЕленаПрекрасная ! Не сочтите за дерзость, но Вы не узнавали сколько примерно стоит готовая система, хотя и настроенная на заемщиках Нидерландов и Бретани (у нас все это не работает)? Ответ на этот вопрос и прояснит границы возможных "откровений".
                              Общее замечание такое: посмотрите, как закончил 7 месяцев 2005 г. Хоум (кстати, считается лидером потребиловки в Восточной Европе!): с убытком по российским стандартам при просрочке около 23% (официально показано). А работал, наверное, на скоринговых системах собственного или еще более западного розлива.
                              Не годятся эти системки у нас, не работают, как ожидалось. Более того, и внутри страны - то, что в Москве и Питере как-то работает - для средних городов и ряда регионов - не совсем годится.
                              Хорошая скоринговая система - это не стандартная машина проводок (АБС банковская) коих на рынке пруд пруди. Такая система должна под конкретный банк "затачиваться", проверяться на независимой выборке. И денег определенных все это стоит.

                              Комментарий


                              • Risk
                                Так я о том же и говорила - полностью с Вами согласна по всем пунктам. Причем (хотя я не математик и не программист) система оценки должна постоянно актуализироваться, с появлением нового клиента, например, параметры которого не учтены в действующей системе. И характеристики выборки постоянно изменяются с изменением кредитного портфеля.
                                В этой связи меня всегда удивляет самонадеянность специалистов в небольших банках, гордящихся, что они почти полностью перешли на "экспертные" оценки (экспертов тоже подбирают с научным подходом), а коэффициенты считают для ЦБ.

                                Комментарий


                                • ЕленаПрекрасная

                                  Честно говоря в небольших банках как раз жуткая нехватка скориг-алгоритма..
                                  А про самонадеянность - это скорее объяснение невозможности потратиться на скоринг-алгоритм.


                                  Risk

                                  То есть в Excel всетаки можно модель построить...

                                  Комментарий


                                  • ЕленаПрекрасная ! Вы, как всегда, правы!!! Даже сделанная для конкретного банка скоринговая машина может иметь модификации по городам и весям в соответствии с региональной сетью. И обновляться хотя бы ежеквартально - ведь банк "кровью" (просрочкой) оплачивает получение новых данных - и скоринг должен корректироваться. Бывали, например, такие дела, когда вводили в некоторых городах отдельную графу - принадлежность к нескольким градообразующим предприятиям - были системные кризисы с з/п.

                                    Морковкин Артем ! В самом простом случае имеем дискриминантную функцию - это просто линейная функция, т.е. набор коэффициентов и константа - Excel за глаза хватит чтобы это реализовать и разослать по кредитным подразделениям. Деревья - не шибко "ветвистые" - тоже можно, все ограничивается предельной вложенностью любимой функции ЕСЛИ. Если надо сделать "красиво" - с экранами, контролем полей ввода, ограничением лицензий (чтобы контролировать колько копий установлено) и т.д. - здесь надо привлекать программиста среднего уровня. По моим оценкам, если исходные данные в наличии, срок разработки - не более месяца (с 2-м запасом).
                                    Однако, главное здесь сама схема классификации типа "вернет", "не вернет", "вернет с просрочкой" и т.д. И Ваш вопрос, наверное, об этом? Думаю, что в Excel можно сделать простой дискриминантный анализ. Деревья и сети - вряд ли. Или - все самому и вручную.

                                    Вообще, общее замечание: западные скоринговые системы - это мерседесы и лексусы, а нужен - недорогой, понятный, надежный фольксваген-жук.

                                    Комментарий


                                    • Risk

                                      Кстати приславутые 7 ограничений функции ЕСЛИ можно обходить...
                                      С помощью тойже функции, я так около 42 вариантов проделывал.

                                      Комментарий


                                      • Морковкин Артем ! Да, действительно. Т.о. - все возможно.

                                        Комментарий


                                        • Коллеги,
                                          сейчас занят поиском подходящей системы скоринга физ. лиц для банка.Есть следующая дилемма:
                                          - купить зап.систему - минусы вы осветили выше, не со всем согласен(например, с оценком Risk-ом Хома. Во-первых, банк никогда не считался лидером в Восточной Европе. В родной Чехии он далеко не первый.Во-вторых, банк, если и применял западный скоринг, то до конца первого квартала 2005 года (несколько лет на рынке) оставался в плюсе,т.е. скоринг работал).
                                          - купить "нашу" разработку. Посмотрел по сайтам несколько наших фирм, в том числе те, что упоминались в форуме. Действительно, есть интересные предложения. Но когда с ними (фирмами) говоришь о числе в несколько тысяч договоров в день и работе по всей территории РФ разговор "уходит".
                                          Словом есть плюсы и минусы в каждой системе. Но как и в любом деле есть желание сразиться с сильнейшими.
                                          Может сможет кто-либо поделиться опытом работы у лучших:Русский стандарт, Хоум, Райф. банк и др., - те, которые кредитуют массы. Нужна фирма, которая имеет опыт именно с массовыми и территориальными - (Россия) проектами. Уверен, что каждый потом проводил адаптацию под себя, но хочется начать с того, что уже зарекомендовало себя на рынке.
                                          Если знаете такие фирмы, то скиньте, пожалуйста, на b-mail или на avilad@yandex.ru
                                          Спасибо.

                                          Комментарий


                                          • vald! "Во-вторых, банк, если и применял западный скоринг, то до конца первого квартала 2005 года (несколько лет на рынке) оставался в плюсе,т.е. скоринг работал)".
                                            Это как же понимать прикажете? Как раз "скоринг" и не работал - навыдавали и очень быстро наступили результаты. Ваш ответ может быть верен при одном условии - если заемщик явный мошенник и не платит по кредиту вообще ни копейки. Но что же это такое тогда вообще?

                                            Кстати, vald, а у Вас хранилище данных "живое"? Или еще проще - у Вас данные хоть в электронном виде (данные анкет, договоров, "вернул", "не вернул", "вернул, но долго мучился"...)? "Уход" фирм отчасти понятен - им проще разовая установка. Но, смотрите:
                                            1. Скоринг в Москве и скоринг в Урюпинске - разные вещи. Даже если анкета едина, сам алгоритм будет разный в силу разной значимости и структурной зависимости факторов.
                                            2. Скоринг надо "вести" - обновлять в разрезе групп филиалов (примерно однородных, если это возможно) регулярно. Иначе, через полгода многое может "поплыть" и начнут расти ошибки 1-го и 2-го рода. А это значит - долгосрочные отношения с разработчиком.
                                            3. Основной критерий скоринговых систем - в отличие от АБС стандартных - качество работы, а не число ошибок в проводках и формировании отчетности. Это - совсем иное дело, не такое легкое как кажется. ведь заказчик начнет "предъявлять" если что (ошибки пойдут, а это - деньги). И здесь не "стандарта" как в АБС.

                                            Может быть поэтому и "уходит" разговор, хотя странно - это постоянный и устойчивый источник дохода. Я тоже сайты посмотрел - фирмы эти "от метода" идут и решения вроде в разных областях, но "из одного метода родом". Продолжу поиски, но пока на горизонте ничего не видно.

                                            В общем - плачу и рыдаю , хоть работу бросай и создавай фирмочку - вроде и спрос появляется и отработано уже все - тока программист нужен (пока 1) и приходящий бух. Но когда???? Без партнеров не обойтись.
                                            Я даже подумывал предложить тут за бесплатно сделать скоринг на исх. данных заказчика (обезличенно, анонимно) - правда без красивостей - в виде алгоритма или максимум открытой Excel книжки. Может в октябре хоть чуть-чуть освобожусь.
                                            Последний раз редактировалось Risk; 20.09.2005, 08:15.

                                            Комментарий


                                            • Да, забыл добавить - относительно предварительных результатов тестов. Объем выборки, правда небольшой - 513 "дел" (по сути - проба в масштабах одного филиала, да и то, не очень представительная).
                                              Выборка разбивалась на 2 части - обучающая и контрольная.
                                              Результаты по контрольной выборке - деревья решений - 95% правильных ответов;
                                              сети: тестировалось порядка 20 сетей, победил один из многослойных персептронов, оставив далеко позади линейные сети и сети с радиальными базисными функциями. 88% правильных ответов.

                                              Комментарий


                                              • Risk!
                                                Это как же понимать прикажете? Как раз "скоринг" и не работал - навыдавали и очень быстро наступили результаты. Ваш ответ может быть верен при одном условии - если заемщик явный мошенник и не платит по кредиту вообще ни копейки. Но что же это такое тогда вообще?
                                                В любом банке, работающем с "быстрыми" кредитами - напр. РС, Хоум или ОВК(который РОС) вам скажут, что средний кредит 8-10 месяцев. Эта цифра признается всеми. Все эти банки работают на рынке, как минимум в 3 раза больше, т.е. плохой скоринг должен был проявиться гораздо раньше, как с мошенниками, так и с другими. А здесь резкое падение прибыли......
                                                Может быть поэтому и "уходит" разговор, хотя странно - это постоянный и устойчивый источник дохода.
                                                Так и есть.
                                                Вспоминаю рассказы своего друга, который несколько лет проработал в Узбекистане по линии автопрома. Так вот, там каждый второй знает Каримова и готов посодействовать в личной встрече. Надо только немного денег...
                                                Так и у нас. Приходишь на фирму, тебе презентуют модель скоринга, много математики и спец. терминов. А когда заводишь разговор о реально сделанных проектах, то в лучшем случае это малые модели с ограниченным количеством регионов. Причем каждая фирма (например, с офисом в 5 кв.м и 5 сотрудниками, включая уборщицу) готова браться за глобальный проект по всей России."Токо денег дайте!"....
                                                Потому и надеюсь, что найдутся знающие люди и главное с реальным, а не бумажным опытом.

                                                Комментарий


                                                • vald ! По первому пункту наверное да, но факт фактом - может и устаревший скоринг внес свою лепту.

                                                  По второму пункту. Я в раздумье. Тут меня в очередной раз на побывку в Мск (домой) отпускают - буду встречаться со старыми друзьями и обсуждать тему отдельного бизнеса. Нужна их организационная поддержка.
                                                  Вообще, даже малые и новые фирмы, прежде чем "заявляться" громко должны 1-2 скоринговых программы сделать просто так - за право ссылаться, что проект реализован. И не терминами надо банкиров мучить - а сказать вот ваши исх. данные (были представлены) вот - продукт - давайте проверять на тех данных, которых у разработчиков не было. Если все ок - типа и точность устраивает, ну мона цвет экранов и размер полей ввода "отрихтовать" и т.д. - и потом только о ценах договариваться, включая сопряжение (обмен данными) с существующей АБС. А это - тоже актуально - не будет же несчастный кредитный инспектор данные о клиенте несколько раз забивать. + говорить о числе версий для разных регионов + о периодике абонементного обслуживания. Т.е. "товар" надо предъявить, предварительно сделав его под конкретного заказчика, на его исх. данных, и тогда уже о ценах говорить. Рынок сейчас пуст, в "больших" автоматизаторов просто не верю - насмотрелся как они многосотенными коллективами не могут очень простые и понятные вещи в обозримые сроки делать - даже по представленным простым алгоритмам (выбрать по условиям, сложить, поделить, вывести на экран и в форму на бумагу...) и т.д. Уже и ЦБ все бумажки выпустил и т.д., а сытые локальные монопсонисты играют в "переписку". А каких денег все это стоит??? Причем, АБС не зависят от региона - проводки и отчетность одинаковые.
                                                  Кстати о "больших" автоматизаторах (это которые АБС ставят и "починяют") - с ними давно работаю, со стороны заказчика. В последние 2-3 года они вообще почти перестали шевелиться. Вчера смотрел "скоринг" в одной из прославленных АБС - ну заставка просто, "лейбл".

                                                  Комментарий


                                                  • [i]В любом банке, работающем с "быстрыми" кредитами - напр. РС, Хоум или ОВК(который РОС) вам скажут, что средний кредит 8-10 месяцев. Эта цифра признается всеми. Все эти банки работают на рынке, как минимум в 3 раза больше, т.е. плохой скоринг должен был проявиться гораздо раньше, как с мошенниками, так и с другими. А здесь резкое падение прибыли......[/i

                                                    У сотовых операторов тоже закончился лимит рос.граждан. Кол-во потенциальных заемщиков в любом случаи ограничено. Я думаю тут проблема рынка а не скоринг модели. Не зря тот же РС,И ХК уже пытаются свою монопродуктовость разбавить. Если уже по всем более менее сытым регионам в каждом ТЦ (отдел электроники) сидит по 3-4 банка, это слишком. Да, этот рынок в любом случаи интересен и тенденция хорошая. Но все эти показанные убытки они не просто так. Рынок ссужается. Ну этот вопрос больше к маркетологам и аналитикам.

                                                    Блин, забыл зачем зашел сюда, ну да скоринг по малым и средним предпринимателям. Слышал что КМБ, и Импекс об этом заявляли, ИМпекс даже реализовал. Но мне каж-сф что тут просто ускоренную экспертную оценку назвали скорингом. Суммы большие (до 30 тыш уев)а потому мало кто доверит такие суммы "жидкой" статистике. А все таки есть ли наработки тут хотя бы западные (SME lending). Но думаю что их то все и нужно будет переделывать
                                                    Risk -А как кредитные истории можно в скоринг завести. Слышал что в продвинутых североамериканских штатах софт коллекторы работают уже больше с моделью поведения человека как заемщика которая также есть некий скоринговый продукт. И по типажу определяют склоность его (заемщика) к невозврату.
                                                    Люблю деньги, но пpедельно пpофессионально. (Киpиенко, по HТВ, 24.03.1998)

                                                    Комментарий


                                                    • STARTNEW ! В стране имеются 2 (две) коллекторские компании - Секвойя и еще какая-то - они и работают на системках с моделями поведения "невозвращенцев". Это специфический такой скоринг - типа стоит ли брать такой кредит в работу по "возврату". Отсеивается явный "неликвид" - т.е. "невозврат".
                                                      Согласен в Вами - "пенки" с рынка уже сняты - "легкая нефть" кончилась - дальше тока "urals" и "обводненные скважины".
                                                      Бюро кредитных историй пока не поможет в скоринге - посмотрите, что содержится в самом бюро - по закону - там почти нет данных для скоринга. Но есть важное по прошлому - вернул/не вернул.
                                                      Поэтому, скоринг будет расти и развиваться - объективно, особенно при работе с новыми "пластами" заемщиков, по которым в БКИ ничего нет.

                                                      Комментарий


                                                      • Господа необходим совет профессионалов!

                                                        Поставил перед собой задачу сделать простенькую скоринговую модель скажем используя множественую линейную регрессию.

                                                        Вопросы в данном случае каким образом строить функцию

                                                        Скажем так имеем два фактора возраст и доход/платежу

                                                        Имеем три кредита плохой и 2 хороших.

                                                        Параметры плохого кредита 37 лет 80%

                                                        Параметры хороших: 1) 25 лет, 30%
                                                        2) 28 лет, 23%

                                                        Могу я сделать следующее:

                                                        Функция: плохой - 1, хороший - 0
                                                        Независимые переменные
                                                        Возраст
                                                        до 28 - 2/3 (отношение хороших с данным признаком кредитов ко всем кредитам)
                                                        от 29 - 1/3
                                                        Доход
                                                        до 30% - 2/3
                                                        от 31% - 1/3

                                                        Исследуем следующее уравнения

                                                        1=а+w1/3+w1/3
                                                        0=а+w2/3+w2/3
                                                        0=а+w2/3+w2/3

                                                        В результате получаем модель...

                                                        Не судите строго! И расскажите что у меня не так и что я не правильно сделал. Если не сложно покажите на этом же примере как бы сделали Вы!

                                                        Просто очень хочется разобраться в скоринге.

                                                        Комментарий


                                                        • Смотрю давно не обсуждали тему скоринг.
                                                          Кто-нибудь может мне помочь, где можно найти расчеты по затратам и окупаемости скоринговой системы физ.лиц?
                                                          Как можно расчитать?
                                                          Последний раз редактировалось Морковкин Артем; 12.01.2006, 16:18.

                                                          Комментарий


                                                          • Yanochka
                                                            Можно чуть более подробно?
                                                            (Виды кредитования, объем портфеля и т.п. - все, что можете).
                                                            Можно на мыло:
                                                            Alexander.Frolov сОбАкА ksema.ru

                                                            Комментарий


                                                            • Друзья, Александер летом 2002 года задал вопрос о программных продуктах:-).

                                                              Они есть, разные, начиная от дорогих и универсальных (например, решения от SAS) и заканчивая специализированными с умеренной ценой.
                                                              Названия легко найти, набрав в поисковике data mining software. Мне довелось работать с несколькими.

                                                              Clementine - продукт продвигаемый SPSS, содержит множество инструментов для предварительной обработки данных и несколько алгоритмов для построения моделей: C4.5, C5, кластерный анализ, нейронные сети.

                                                              SPSS Answer Tree – специализированная программа для построения классификационных деревьев. Работает с подготовленным файлом данных.

                                                              CART (classification and regression trees) – узко специализированный продукт для решения задач классификации и регрессии. Использует методы CART, Combine (адаптивная подстройка), Treenet, Random Forests. Построенную модель можно сохранить как программный код, который затем можно использовать в собственной программе. На оф. сайте дают скачать программку и можно 3 дня с ней поиграться.

                                                              Что есть из free (шного)
                                                              – Ross Quinlan (автор алгоритма C4.5) – код на сайте.
                                                              - Leo Breiman (классик, оставил всем наследство - последнюю разработку – Random Forests);
                                                              - его коллега – Friedman (автор алгоритма Treenet) сделал его доступным в пакете R в виде подключаемого модуля.
                                                              - Есть еще много других, см например http://www.kdnuggets.com/

                                                              Что выбрать для задачи скоринга физиков? Однозначно алгоритм деревьев классификации. По точности не хуже нейронных сетей, но меньше проблем, в том числе при подготовке данных. Но что более важно – модель в виде дерева легко интерпретировать и предъявить в случае необходимости контролирующим органам. До нас демократия еще не дошла и не скоро, наверное (если в такой мере) дойдет. Есть юридический аспект в этом деле :-). Законодательства в развитых странах запрещают дискриминацию по ряду признаков, плюс есть «сроки давности» дальше которых кредитные бюро заглядывать не имеют права (кажется 6 лет в США). Модели, построенные на нейронных сетях, не позволят увидеть как независимые переменные влияют на результат. Бинарные деревья в этом плане очень прозрачны.

                                                              Risk в сентябрьских постах правильно осветил суть работы с такими программами, сперва их надо обучить, а потом новые данные можно пропустить через модель и узнать к какому классу относится заемщик. Так же правильно названа самая популярная книга с описанием алгоритма CART, хотя алгоритм описывали и раньше.

                                                              На русском есть книга В. Дюк, А. Самойленко Data Mining: учебный курс. Немного старая, но для начала годится. Математика (многомерная статистика) есть в книгах Айвазяна. Потом поисковиком можно столько нарыть, что утонешь. Единственное что не удалось найти – это более-менее реальных наборов данных :-).

                                                              Извините, что сумбурно. Наверное надо бы изложить все систематически, но как-то руки не доходят. Вопросы? Пишите reg2@ukr.net Евгений.

                                                              To psch: Вы спрашивали про компанию www.bns.com.ua. Я им писал – они не ответили. Такое впечатление, что бизнес у них не сложился :-)

                                                              Комментарий

                                                              Пользователи, просматривающие эту тему

                                                              Свернуть

                                                              Присутствует 1. Участников: 0, гостей: 1.

                                                              Обработка...
                                                              X