14 октября, понедельник 20:51
Bankir.Ru

Объявление

Свернуть
Пока нет объявлений.

Скоринг частные лица

Свернуть
X
  • Фильтр
  • Время
  • Показать
Очистить всё
новые сообщения

  • Alex101 давно пора уже выдать приз за "неутомимую пропаганду KXEN". Что поделать, Ваша работа продавать этот продукт, но зачем так открыто и постоянно рекламировать его на форуме?

    И к Вам вопросы.

    1. Вы сказали преимущество "Цена" - так 1 лицензия KXEN стоит, насколько мне известно, 50 тыс. евро - это и есть "преимущество" в цене? Готовое решение K4Loans обойдется явно не меньше 150 тыс.

    2. Какая методическая поддержка для решения смежных задач у Вас имеется? Причем русскоязычная - документация, кейсы, примеры построения скоринговых моделей?

    3. Например в SAS имеется хранилище данных, позволяющее консолидировать свю необходимую информацию для анализа в одном месте - KXEN предоставляет такую возможность?

    4. Что делать банку с Вашим KXEN если у него нет кредитных историй?

    5. Как насчет интергации с популярными АБС?

    6. Возможности очистки, трансформации, предобработки данных?

    7. Как обеспечивается безопасность скоринг-моделей?

    Комментарий


    • Сообщение от amalrik
      И к Вам вопросы.
      Большое спасибо за вопросы.
      Сообщение от amalrik
      1. Вы сказали преимущество "Цена" - так 1 лицензия KXEN стоит, насколько мне известно, 50 тыс. евро - это и есть "преимущество" в цене? Готовое решение K4Loans обойдется явно не меньше 150 тыс.
      На самом деле готовое решение K4Loans + KXEN может быть как существенно дешевле, так и дороже. Не зная потребностей банка, нельзя однознаяно ответить.
      Сообщение от amalrik
      2. Какая методическая поддержка для решения смежных задач у Вас имеется? Причем русскоязычная - документация, кейсы, примеры построения скоринговых моделей?
      Есть и русскоязычная документация, и кейсы, и примеры построенных моделей + строим модели на данных Заказчика (бесплатно).
      Сообщение от amalrik
      3. Например в SAS имеется хранилище данных, позволяющее консолидировать свю необходимую информацию для анализа в одном месте - KXEN предоставляет такую возможность?
      В K4Loans имеется витрина данных, в которой консолидируется информация по кредитам.
      Сообщение от amalrik
      4. Что делать банку с Вашим KXEN если у него нет кредитных историй?
      Тут уже вопрос к специалистам банка - анализировать заемщиков, которым не выдали кредит при заведомо завышенном балле отсечения, накапливать эту историю (например какому-то проценту заемщиков выдавать кредит, независимо от оценок), ...
      Это уже надо банку решать.
      Можно вообще на первое время приобрести только K4Loans.
      Сообщение от amalrik
      5. Как насчет интергации с популярными АБС?
      С некоторыми мы интегрировались, посмотрите на список наших "открытых" клиентов, насколько они "популярны", решать Вам.
      Сообщение от amalrik
      6. Возможности очистки, трансформации, предобработки данных?
      А как же, есть модуль Data Manipulation.
      Сообщение от amalrik
      7. Как обеспечивается безопасность скоринг-моделей?
      [/QUOTE]
      Что Вы понимаете под безопасностью?

      Извините, если кого-то раздражают мои сообщения про KXEN и K4Loans.

      Комментарий


      • Сообщение от Alex101
        Большое спасибо за вопросы.

        На самом деле готовое решение K4Loans + KXEN может быть как существенно дешевле, так и дороже. Не зная потребностей банка, нельзя однознаяно ответить.

        Есть и русскоязычная документация, и кейсы, и примеры построенных моделей + строим модели на данных Заказчика (бесплатно).

        В K4Loans имеется витрина данных, в которой консолидируется информация по кредитам.

        Тут уже вопрос к специалистам банка - анализировать заемщиков, которым не выдали кредит при заведомо завышенном балле отсечения, накапливать эту историю (например какому-то проценту заемщиков выдавать кредит, независимо от оценок), ...
        Это уже надо банку решать.
        Можно вообще на первое время приобрести только K4Loans.

        С некоторыми мы интегрировались, посмотрите на список наших "открытых" клиентов, насколько они "популярны", решать Вам.

        А как же, есть модуль Data Manipulation.
        Что Вы понимаете под безопасностью?

        Извините, если кого-то раздражают мои сообщения про KXEN и K4Loans.[/QUOTE]

        Как может это стоить существенно дешевле, если 1 лицензия на программу стоит 50 тыс. евро? Потребности у банков одинаковые - минимизировать риски по кредитом при увеличивающемся объеме их выдачи.
        Как можно разработать кейсы, примеры, документацию на русском и т.д., если Вашему решению около полугода и оно обкатано всего в одном банке? Русифицирован ли сам интерфейс пакета KXEN?
        Витрина данных - вероятно на основе какой-то (какой?) СУБД - снова деньги на лицензирование СУБД?
        Повторю вопрос - что делать с Вашим чудом банкам, у которых нет кредитных историй по рознице вообще и они впервые выходят на этот рынок? Или открывают новую кредитную программу с существенно отличными требованиями? Ответ Вы дали (точнее не дали) - ничего конкретного в этой ситуации Вы предложить не можете.
        Про какие баллы идет речь? Вы в курсе что балльная методика - наименее эффективная, поскольку моделирует сугубо линейные зависимости между параметрами заемщиков? И вы еще строите скоринговые модели??
        Так с кем Вы интегрировались из АБС? С R-Style, Diasoft или кем? Это секрет? Зачем куда то ходить смотреть?

        Вобщем, вывод: если Вам хочется потратить много денег впустую, покупайте KXEN. А если нет, то стОит поискать получше и, как это неудивительно, подешевле.

        Комментарий


        • amalrik Alex101 Выношу предупреждение обоим. Вы сильно удалились от первоначальной темы. Обсуждение программных продуктов в другом месте.

          Комментарий


          • amalrik
            http://dom.bankir.ru/showthread.php?...85#post1779085
            Лучше здесь дальше обсуждать, иначе нас с форума выгонят.

            Комментарий


            • to Кобра: сугубое имхо - зря. Инфо про продуктам ищут именно в этой теме, а функционал оценить необходимо.
              Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

              Комментарий


              • Наше кредитное бюро (у нас с ним договор), предоставляет услуги скоринга. За ПО денег не взяли, мы платим только за оценку заемщиков.

                Комментарий


                • Сообщение от D_vice Посмотреть сообщение
                  Наше кредитное бюро (у нас с ним договор), предоставляет услуги скоринга. За ПО денег не взяли, мы платим только за оценку заемщиков.
                  ...а в каком формате кредитное бюро выдает оценку заемщика? В смысле: хороший/ плохой или как ?

                  Комментарий


                  • D_vice Что за бюро? И сразу еще вопрос, а какую информацию о заемщике вы им передаете?
                    Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                    Комментарий


                    • Для Psch и Sonny: У нас договор с "Центральное кредитное бюро".
                      Данные мы передаем такие: Родился, крестился (паспортные), дата заключения договора, сумма договора и график платежей с суммами платежей.
                      По поводу скоринга. Отчет выдается с разблудовкой по составляющим риска. Мы настроили так, что попутно выдается сообщение о том что для данного заемщика превышена вероятность возникновения дефолта в период кредитования и выводится домпустимы кредитны лимит. О системе можно почитать на www.tscoring.ru

                      Комментарий


                      • Вопросы к практикующим дата майнерам.
                        1) В сырых данных, на которых строится модель, имеем некоторое соотношение объектов разных классов ("плохой заемщик", "хороший заемищик"). Есть ощущение что надо искуственно сделать соотношение 50 на 50, а то можно нарваться на классический пример про правило Байеса. Прав ли я? Какая методология лежит за этим действием?
                        2) Отсеиваете ли скореллированные переменные, какую корреляцию считаете существенной.
                        3) Прибегаете ли вы к модификации переменных, дабы их функция распределения становилась похожей на нормальное распределение, либо, может быть, уповаете на закон больших чисел?
                        Спасибо!
                        Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                        Комментарий


                        • Сложно дать ответ, не зная метод Data Mining который Вы применяете. Для логистической регрессии советы одниЮ для деревьев решений - другие и т.д.

                          Комментарий


                          • Сообщение от amalrik Посмотреть сообщение
                            Сложно дать ответ, не зная метод Data Mining который Вы применяете. Для логистической регрессии советы одниЮ для деревьев решений - другие и т.д.
                            Давайте для тех и для других С методом я пока не определился. Нравятся деревья, потому как наглядно. Но свои недостатки у них тоже есть. Точность, например, у регрессии повыше обычно получается.
                            Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                            Комментарий


                            • ...а насколько большой набор данных?

                              Комментарий


                              • Думаю это не принципиально, посколько вопросы теоретические. Предположим, что большой.
                                Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                Комментарий


                                • Сообщение от Sonny Посмотреть сообщение
                                  Давайте для тех и для других С методом я пока не определился. Нравятся деревья, потому как наглядно. Но свои недостатки у них тоже есть. Точность, например, у регрессии повыше обычно получается.
                                  Один из самыъ распространенных мифов среди банкиров (видимо, сказываются пробелы в математическом образовании).

                                  Линейная/логистическая регрессия моделирует ТОЛЬКО линейные зависимости. На практике зависимости между параметрами заемщика и его кредитоспособностью в большинстве случаев - НЕлинейные (но не всегда).

                                  Если интересно, возьмите любой учебник по нейронным сетям и почитайте про проблему XOR. Ни линейная, ни логистическая регрессия с ней не справляются.

                                  Деревья решений моделируют нелинейные зависимости (в том числе и линейные, естественно). Поэтому точность у деревьев всегда выше.

                                  Другое дело, что у логистической регрессии есть другие плюсы, в частности, ROC-анализ и некоторые другие.

                                  Поэтому на практике не нужно зацикливаться на одной модели, а "прогонять" заемщика через несколько моделей и выбирать наиболее достоверный ответ.

                                  Комментарий


                                  • Спасибо за отклик. А по поставленным вопросам можно комментарий?
                                    Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                    Комментарий


                                    • Sonny
                                      1) Размеры обучающей и тестовой выборок зависят от объема данных. Если данных у Вас достаточно много, то возьмите соотношение 80-20%. Самое главное, чтобы обучающей выборки хватило для построения адекватной модели.
                                      Иногда случается, что тестовая выборка не отражает взаимосвязи некоторых рассматриваемых признаков из обучающей выборки, т.е. дисперсии и средние признаков из тестовой выборки значимо отличаются от дисперсий и средних соответствующих признаков обучающей выборки. Поэтому проверку качества классификации модели обычно осуществляют на 10-20 наборах обучающих и тестовых выборках, сформированных случайным образом. А полученные в итоге результаты усредняют.

                                      Кроме того, можно использовать другой способ оценки качества классификации модели - jack-knife (русское название метода не помню). Основной смысл в том, что из исходной выборки изымается 1 объект, а по оставшимся данным строится модель. Далее проверяется правильно ли полученная модель классифицировала изъятый объект. И так процедура повторяется для заданного числа объектов, в результате чего подсчитывается число ошибочных классификаций.

                                      Комментарий


                                      • Сообщение от dmigma Посмотреть сообщение
                                        Кроме того, можно использовать другой способ оценки качества классификации модели - jack-knife (русское название метода не помню).
                                        Распространенный русский эквивалент: метод складного ножа.

                                        Комментарий


                                        • Спасибо конечно, но вопрос о соотношении обучающей и тестовой выборки я не задавал. Меня интересует вопрос о соотношении хороших и плохих объектов в обучающей выборке. Для деревьев я предполагаю искусственно выравнивать их соотношение не требуется. А для регрессии?
                                          Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                          Комментарий


                                          • Sonny
                                            Если по Вашим данным распределение хороших/плохих, например, 85/15%, то и вероятно, искусственно приводить к 50/50% не надо - можно нарушить исходное распределение по признакам.

                                            Комментарий


                                            • Sonny
                                              Про корреляцию:
                                              Есть же критерии значимости корреляции между значениями двух признаков. В случае, если коэффициент значим, и Вы экспертно можете подтвердить наличие непосредственной связи между этими признаками, то один из них исключается из дальнейшего анализа. Если экспертно подтвердить нельзя, то корреляция либо ложная, либо обусловлена влиянием третьих признаков, и требуется более глубокий анализ.
                                              Если все вышасказанное не помогает, то субъективно 0.7-0.9 (в зависимости от задачи) для меня уже сущесвтенная корреляция.

                                              Про модификацию переменных:
                                              Что Вы подразумеваете под модификацией?

                                              Комментарий


                                              • Модификация - преобразование. Была переменная X, стала, например, 2X*X-1. Интересно, надо ли при построении логистической регрессии модифицировать переменные, чтобы их распределение становилось более похожим на нормальное.
                                                Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                                Комментарий


                                                • Мне все равно кажется, что для регрессий надо брать соотношение классов в обучающей выборке 50 на 50. Есть качественные математики могущие аргументированно подтвердить, опровергнуть?
                                                  Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                                  Комментарий


                                                  • Sonny
                                                    Мне все равно кажется, что для регрессий надо брать соотношение классов в обучающей выборке 50 на 50. Есть качественные математики могущие аргументированно подтвердить, опровергнуть?
                                                    Соотношение между объемом плохих и объемом хороших данных не является здесь самым определяющим. Гипотеза скоринга, анкетного скоринга, заключается в том, что кредитная история человека предопределена его социально-демографическими данными, а точнее внутренними связями между этими данными, именно внутренними связями. Т.е., скажем, процент дефолтности для одиноких мужчин с образованием не выше среднего, сменивших место работы менее 1 года назад и классифицирующих себя как вспомогательный/технический персонал будет конечно же высоким, и в обучающей выборке, заметите вы это или нет, но для людей с такими признаками вы будете иметь в зависимой переменной score больше нуликов, чем единичек. Просто при больших объемах данных визуально заметить такие взаимосвязи очень сложно, поэтому и используются стат. пакеты.

                                                    На практике для построения модели можно руководствоваться правилом 80/20 при общем объеме имеющегося портфеля 2000.

                                                    Интересно, надо ли при построении логистической регрессии модифицировать переменные, чтобы их распределение становилось более похожим на нормальное.
                                                    В этом другое преимущество использхования готовых решений, т.е. стат. пакетов - все необходимые преобразования и "приведение данных под метод" они делают сами.
                                                    Последний раз редактировалось Jimmy Ionic; 21.09.2006, 12:13.

                                                    Комментарий


                                                    • Сообщение от Александер Посмотреть сообщение
                                                      Многоуважаемые товарищи!

                                                      Поделитесь, если у кого есть информация, какие программные продукты используются для оценки кредитоспособности заемщика-физ. лица, сколько может стоить такой продукт. Кроме того приветствуется вся интересная информация по этой теме.
                                                      Могу продать калькулятор

                                                      Комментарий


                                                      • Jimmy Ionic Куплю хрустальный шар, он сам все посчитает. Есть потребность разобраться. Вопрос остается открытым.
                                                        Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                                        Комментарий


                                                        • Jimmy Ionic Если у вас в обучающей выборке дефолтников 20% задайтесь вопросом: какова вероятность того, что потенциальный заемщик, которого скоринг обозвал "плохим" действительно плохой? Чем меньше дефолтов в обучающей выборке, тем смехотворнее будет эта цифра. Я могу ошибаться, тем не менее кажется 50-50.
                                                          Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                                          Комментарий


                                                          • Sonny

                                                            Вы ведь не простые вероятности считаете. Речь идет о качественных признаках плохих клиентах. Если эти признаки чётко проявляются уже при малых соотношениях плохой/хороший, то можно строить модель. Я не говорю что Ваши 50/50 - это неверно. Возьмите так, если хотите. Я говорю, что в портфеле достаточно иметь уже 20% плохих клиентов, чтобы начинать строить модель.

                                                            Комментарий


                                                            • Jimmy Ionic Зачем же доводить до 20% Вы не поняли мой вопрос. Я спрашиваю, надо ли искуственно размножать записи до соотношения классов 50 на 50 перед тем, как запускать регрессию.
                                                              Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                                              Комментарий

                                                              Пользователи, просматривающие эту тему

                                                              Свернуть

                                                              Присутствует 1. Участников: 0, гостей: 1.

                                                              Обработка...
                                                              X