10 июля, пятница 12:06
Bankir.Ru

Объявление

Свернуть
Пока нет объявлений.

Скоринг частные лица

Свернуть
X
  • Фильтр
  • Время
  • Показать
Очистить всё
новые сообщения

  • Alex101 давно пора уже выдать приз за "неутомимую пропаганду KXEN". Что поделать, Ваша работа продавать этот продукт, но зачем так открыто и постоянно рекламировать его на форуме?

    И к Вам вопросы.

    1. Вы сказали преимущество "Цена" - так 1 лицензия KXEN стоит, насколько мне известно, 50 тыс. евро - это и есть "преимущество" в цене? Готовое решение K4Loans обойдется явно не меньше 150 тыс.

    2. Какая методическая поддержка для решения смежных задач у Вас имеется? Причем русскоязычная - документация, кейсы, примеры построения скоринговых моделей?

    3. Например в SAS имеется хранилище данных, позволяющее консолидировать свю необходимую информацию для анализа в одном месте - KXEN предоставляет такую возможность?

    4. Что делать банку с Вашим KXEN если у него нет кредитных историй?

    5. Как насчет интергации с популярными АБС?

    6. Возможности очистки, трансформации, предобработки данных?

    7. Как обеспечивается безопасность скоринг-моделей?

    Комментарий


    • Сообщение от amalrik
      И к Вам вопросы.
      Большое спасибо за вопросы.
      Сообщение от amalrik
      1. Вы сказали преимущество "Цена" - так 1 лицензия KXEN стоит, насколько мне известно, 50 тыс. евро - это и есть "преимущество" в цене? Готовое решение K4Loans обойдется явно не меньше 150 тыс.
      На самом деле готовое решение K4Loans + KXEN может быть как существенно дешевле, так и дороже. Не зная потребностей банка, нельзя однознаяно ответить.
      Сообщение от amalrik
      2. Какая методическая поддержка для решения смежных задач у Вас имеется? Причем русскоязычная - документация, кейсы, примеры построения скоринговых моделей?
      Есть и русскоязычная документация, и кейсы, и примеры построенных моделей + строим модели на данных Заказчика (бесплатно).
      Сообщение от amalrik
      3. Например в SAS имеется хранилище данных, позволяющее консолидировать свю необходимую информацию для анализа в одном месте - KXEN предоставляет такую возможность?
      В K4Loans имеется витрина данных, в которой консолидируется информация по кредитам.
      Сообщение от amalrik
      4. Что делать банку с Вашим KXEN если у него нет кредитных историй?
      Тут уже вопрос к специалистам банка - анализировать заемщиков, которым не выдали кредит при заведомо завышенном балле отсечения, накапливать эту историю (например какому-то проценту заемщиков выдавать кредит, независимо от оценок), ...
      Это уже надо банку решать.
      Можно вообще на первое время приобрести только K4Loans.
      Сообщение от amalrik
      5. Как насчет интергации с популярными АБС?
      С некоторыми мы интегрировались, посмотрите на список наших "открытых" клиентов, насколько они "популярны", решать Вам.
      Сообщение от amalrik
      6. Возможности очистки, трансформации, предобработки данных?
      А как же, есть модуль Data Manipulation.
      Сообщение от amalrik
      7. Как обеспечивается безопасность скоринг-моделей?
      [/QUOTE]
      Что Вы понимаете под безопасностью?

      Извините, если кого-то раздражают мои сообщения про KXEN и K4Loans.

      Комментарий


      • Сообщение от Alex101
        Большое спасибо за вопросы.

        На самом деле готовое решение K4Loans + KXEN может быть как существенно дешевле, так и дороже. Не зная потребностей банка, нельзя однознаяно ответить.

        Есть и русскоязычная документация, и кейсы, и примеры построенных моделей + строим модели на данных Заказчика (бесплатно).

        В K4Loans имеется витрина данных, в которой консолидируется информация по кредитам.

        Тут уже вопрос к специалистам банка - анализировать заемщиков, которым не выдали кредит при заведомо завышенном балле отсечения, накапливать эту историю (например какому-то проценту заемщиков выдавать кредит, независимо от оценок), ...
        Это уже надо банку решать.
        Можно вообще на первое время приобрести только K4Loans.

        С некоторыми мы интегрировались, посмотрите на список наших "открытых" клиентов, насколько они "популярны", решать Вам.

        А как же, есть модуль Data Manipulation.
        Что Вы понимаете под безопасностью?

        Извините, если кого-то раздражают мои сообщения про KXEN и K4Loans.[/QUOTE]

        Как может это стоить существенно дешевле, если 1 лицензия на программу стоит 50 тыс. евро? Потребности у банков одинаковые - минимизировать риски по кредитом при увеличивающемся объеме их выдачи.
        Как можно разработать кейсы, примеры, документацию на русском и т.д., если Вашему решению около полугода и оно обкатано всего в одном банке? Русифицирован ли сам интерфейс пакета KXEN?
        Витрина данных - вероятно на основе какой-то (какой?) СУБД - снова деньги на лицензирование СУБД?
        Повторю вопрос - что делать с Вашим чудом банкам, у которых нет кредитных историй по рознице вообще и они впервые выходят на этот рынок? Или открывают новую кредитную программу с существенно отличными требованиями? Ответ Вы дали (точнее не дали) - ничего конкретного в этой ситуации Вы предложить не можете.
        Про какие баллы идет речь? Вы в курсе что балльная методика - наименее эффективная, поскольку моделирует сугубо линейные зависимости между параметрами заемщиков? И вы еще строите скоринговые модели??
        Так с кем Вы интегрировались из АБС? С R-Style, Diasoft или кем? Это секрет? Зачем куда то ходить смотреть?

        Вобщем, вывод: если Вам хочется потратить много денег впустую, покупайте KXEN. А если нет, то стОит поискать получше и, как это неудивительно, подешевле.

        Комментарий


        • amalrik Alex101 Выношу предупреждение обоим. Вы сильно удалились от первоначальной темы. Обсуждение программных продуктов в другом месте.

          Комментарий


          • amalrik
            http://dom.bankir.ru/showthread.php?...85#post1779085
            Лучше здесь дальше обсуждать, иначе нас с форума выгонят.

            Комментарий


            • to Кобра: сугубое имхо - зря. Инфо про продуктам ищут именно в этой теме, а функционал оценить необходимо.
              Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

              Комментарий


              • Наше кредитное бюро (у нас с ним договор), предоставляет услуги скоринга. За ПО денег не взяли, мы платим только за оценку заемщиков.

                Комментарий


                • Сообщение от D_vice Посмотреть сообщение
                  Наше кредитное бюро (у нас с ним договор), предоставляет услуги скоринга. За ПО денег не взяли, мы платим только за оценку заемщиков.
                  ...а в каком формате кредитное бюро выдает оценку заемщика? В смысле: хороший/ плохой или как ?

                  Комментарий


                  • D_vice Что за бюро? И сразу еще вопрос, а какую информацию о заемщике вы им передаете?
                    Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                    Комментарий


                    • Для Psch и Sonny: У нас договор с "Центральное кредитное бюро".
                      Данные мы передаем такие: Родился, крестился (паспортные), дата заключения договора, сумма договора и график платежей с суммами платежей.
                      По поводу скоринга. Отчет выдается с разблудовкой по составляющим риска. Мы настроили так, что попутно выдается сообщение о том что для данного заемщика превышена вероятность возникновения дефолта в период кредитования и выводится домпустимы кредитны лимит. О системе можно почитать на www.tscoring.ru

                      Комментарий


                      • Вопросы к практикующим дата майнерам.
                        1) В сырых данных, на которых строится модель, имеем некоторое соотношение объектов разных классов ("плохой заемщик", "хороший заемищик"). Есть ощущение что надо искуственно сделать соотношение 50 на 50, а то можно нарваться на классический пример про правило Байеса. Прав ли я? Какая методология лежит за этим действием?
                        2) Отсеиваете ли скореллированные переменные, какую корреляцию считаете существенной.
                        3) Прибегаете ли вы к модификации переменных, дабы их функция распределения становилась похожей на нормальное распределение, либо, может быть, уповаете на закон больших чисел?
                        Спасибо!
                        Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                        Комментарий


                        • Сложно дать ответ, не зная метод Data Mining который Вы применяете. Для логистической регрессии советы одниЮ для деревьев решений - другие и т.д.

                          Комментарий


                          • Сообщение от amalrik Посмотреть сообщение
                            Сложно дать ответ, не зная метод Data Mining который Вы применяете. Для логистической регрессии советы одниЮ для деревьев решений - другие и т.д.
                            Давайте для тех и для других С методом я пока не определился. Нравятся деревья, потому как наглядно. Но свои недостатки у них тоже есть. Точность, например, у регрессии повыше обычно получается.
                            Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                            Комментарий


                            • ...а насколько большой набор данных?

                              Комментарий


                              • Думаю это не принципиально, посколько вопросы теоретические. Предположим, что большой.
                                Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                Комментарий


                                • Сообщение от Sonny Посмотреть сообщение
                                  Давайте для тех и для других С методом я пока не определился. Нравятся деревья, потому как наглядно. Но свои недостатки у них тоже есть. Точность, например, у регрессии повыше обычно получается.
                                  Один из самыъ распространенных мифов среди банкиров (видимо, сказываются пробелы в математическом образовании).

                                  Линейная/логистическая регрессия моделирует ТОЛЬКО линейные зависимости. На практике зависимости между параметрами заемщика и его кредитоспособностью в большинстве случаев - НЕлинейные (но не всегда).

                                  Если интересно, возьмите любой учебник по нейронным сетям и почитайте про проблему XOR. Ни линейная, ни логистическая регрессия с ней не справляются.

                                  Деревья решений моделируют нелинейные зависимости (в том числе и линейные, естественно). Поэтому точность у деревьев всегда выше.

                                  Другое дело, что у логистической регрессии есть другие плюсы, в частности, ROC-анализ и некоторые другие.

                                  Поэтому на практике не нужно зацикливаться на одной модели, а "прогонять" заемщика через несколько моделей и выбирать наиболее достоверный ответ.

                                  Комментарий


                                  • Спасибо за отклик. А по поставленным вопросам можно комментарий?
                                    Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                    Комментарий


                                    • Sonny
                                      1) Размеры обучающей и тестовой выборок зависят от объема данных. Если данных у Вас достаточно много, то возьмите соотношение 80-20%. Самое главное, чтобы обучающей выборки хватило для построения адекватной модели.
                                      Иногда случается, что тестовая выборка не отражает взаимосвязи некоторых рассматриваемых признаков из обучающей выборки, т.е. дисперсии и средние признаков из тестовой выборки значимо отличаются от дисперсий и средних соответствующих признаков обучающей выборки. Поэтому проверку качества классификации модели обычно осуществляют на 10-20 наборах обучающих и тестовых выборках, сформированных случайным образом. А полученные в итоге результаты усредняют.

                                      Кроме того, можно использовать другой способ оценки качества классификации модели - jack-knife (русское название метода не помню). Основной смысл в том, что из исходной выборки изымается 1 объект, а по оставшимся данным строится модель. Далее проверяется правильно ли полученная модель классифицировала изъятый объект. И так процедура повторяется для заданного числа объектов, в результате чего подсчитывается число ошибочных классификаций.

                                      Комментарий


                                      • Сообщение от dmigma Посмотреть сообщение
                                        Кроме того, можно использовать другой способ оценки качества классификации модели - jack-knife (русское название метода не помню).
                                        Распространенный русский эквивалент: метод складного ножа.

                                        Комментарий


                                        • Спасибо конечно, но вопрос о соотношении обучающей и тестовой выборки я не задавал. Меня интересует вопрос о соотношении хороших и плохих объектов в обучающей выборке. Для деревьев я предполагаю искусственно выравнивать их соотношение не требуется. А для регрессии?
                                          Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                          Комментарий


                                          • Sonny
                                            Если по Вашим данным распределение хороших/плохих, например, 85/15%, то и вероятно, искусственно приводить к 50/50% не надо - можно нарушить исходное распределение по признакам.

                                            Комментарий


                                            • Sonny
                                              Про корреляцию:
                                              Есть же критерии значимости корреляции между значениями двух признаков. В случае, если коэффициент значим, и Вы экспертно можете подтвердить наличие непосредственной связи между этими признаками, то один из них исключается из дальнейшего анализа. Если экспертно подтвердить нельзя, то корреляция либо ложная, либо обусловлена влиянием третьих признаков, и требуется более глубокий анализ.
                                              Если все вышасказанное не помогает, то субъективно 0.7-0.9 (в зависимости от задачи) для меня уже сущесвтенная корреляция.

                                              Про модификацию переменных:
                                              Что Вы подразумеваете под модификацией?

                                              Комментарий


                                              • Модификация - преобразование. Была переменная X, стала, например, 2X*X-1. Интересно, надо ли при построении логистической регрессии модифицировать переменные, чтобы их распределение становилось более похожим на нормальное.
                                                Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                                Комментарий


                                                • Мне все равно кажется, что для регрессий надо брать соотношение классов в обучающей выборке 50 на 50. Есть качественные математики могущие аргументированно подтвердить, опровергнуть?
                                                  Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                                  Комментарий


                                                  • Sonny
                                                    Мне все равно кажется, что для регрессий надо брать соотношение классов в обучающей выборке 50 на 50. Есть качественные математики могущие аргументированно подтвердить, опровергнуть?
                                                    Соотношение между объемом плохих и объемом хороших данных не является здесь самым определяющим. Гипотеза скоринга, анкетного скоринга, заключается в том, что кредитная история человека предопределена его социально-демографическими данными, а точнее внутренними связями между этими данными, именно внутренними связями. Т.е., скажем, процент дефолтности для одиноких мужчин с образованием не выше среднего, сменивших место работы менее 1 года назад и классифицирующих себя как вспомогательный/технический персонал будет конечно же высоким, и в обучающей выборке, заметите вы это или нет, но для людей с такими признаками вы будете иметь в зависимой переменной score больше нуликов, чем единичек. Просто при больших объемах данных визуально заметить такие взаимосвязи очень сложно, поэтому и используются стат. пакеты.

                                                    На практике для построения модели можно руководствоваться правилом 80/20 при общем объеме имеющегося портфеля 2000.

                                                    Интересно, надо ли при построении логистической регрессии модифицировать переменные, чтобы их распределение становилось более похожим на нормальное.
                                                    В этом другое преимущество использхования готовых решений, т.е. стат. пакетов - все необходимые преобразования и "приведение данных под метод" они делают сами.
                                                    Последний раз редактировалось Jimmy Ionic; 21.09.2006, 12:13.

                                                    Комментарий


                                                    • Сообщение от Александер Посмотреть сообщение
                                                      Многоуважаемые товарищи!

                                                      Поделитесь, если у кого есть информация, какие программные продукты используются для оценки кредитоспособности заемщика-физ. лица, сколько может стоить такой продукт. Кроме того приветствуется вся интересная информация по этой теме.
                                                      Могу продать калькулятор

                                                      Комментарий


                                                      • Jimmy Ionic Куплю хрустальный шар, он сам все посчитает. Есть потребность разобраться. Вопрос остается открытым.
                                                        Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                                        Комментарий


                                                        • Jimmy Ionic Если у вас в обучающей выборке дефолтников 20% задайтесь вопросом: какова вероятность того, что потенциальный заемщик, которого скоринг обозвал "плохим" действительно плохой? Чем меньше дефолтов в обучающей выборке, тем смехотворнее будет эта цифра. Я могу ошибаться, тем не менее кажется 50-50.
                                                          Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                                          Комментарий


                                                          • Sonny

                                                            Вы ведь не простые вероятности считаете. Речь идет о качественных признаках плохих клиентах. Если эти признаки чётко проявляются уже при малых соотношениях плохой/хороший, то можно строить модель. Я не говорю что Ваши 50/50 - это неверно. Возьмите так, если хотите. Я говорю, что в портфеле достаточно иметь уже 20% плохих клиентов, чтобы начинать строить модель.

                                                            Комментарий


                                                            • Jimmy Ionic Зачем же доводить до 20% Вы не поняли мой вопрос. Я спрашиваю, надо ли искуственно размножать записи до соотношения классов 50 на 50 перед тем, как запускать регрессию.
                                                              Эксперт - это человек, совершивший все возможные ошибки в узкой сфере деятельности.

                                                              Комментарий

                                                              500 Портал временно недоступен

                                                              Портал временно недоступен

                                                              Возникла ошибка при открытии страницы. Обновите страницу или перейдите на главную
                                                              Обновите страницу спустя некоторое время.

                                                              Агенство Bankir.Ru приносит извинения пользователям
                                                              за доставленные неудобства
                                                              Обработка...
                                                              X