16 октября, среда 03:23
Bankir.Ru

Объявление

Свернуть
Пока нет объявлений.

Скоринг частные лица

Свернуть
X
  • Фильтр
  • Время
  • Показать
Очистить всё
новые сообщения

  • У кого-нибудь есть в электронном виде сии книги :
    В. Дюк, А. Самойленко Data Mining: учебный курс
    Айвазян Математика ???

    Или может кто подскажет в каких московских книжных магазинах их можно купить ?? на ozon-е ее нет в наличии...

    Комментарий


    • Сообщение от Jimmy Ionic
      У кого-нибудь есть в электронном виде сии книги :
      В. Дюк, А. Самойленко Data Mining: учебный курс
      Айвазян Математика ???

      Или может кто подскажет в каких московских книжных магазинах их можно купить ?? на ozon-е ее нет в наличии...
      Есть такой ресурс: www.poiskknig.ru Айвазяна там точно найдешь. Самойленко искать не обязательно. Ищи в Гугле именно то что тебе нужно.

      Комментарий


      • Yanochka!
        "Смотрю давно не обсуждали тему скоринг.
        Кто-нибудь может мне помочь, где можно найти расчеты по затратам и окупаемости скоринговой системы физ.лиц?
        Как можно расчитать?"

        Убедительно прошу не считать это рекламой, а если таки сочтете - что ж, стирате беспощадно. Скоро должен появиться журнал "Банковский ритейл" - первый номер. Пока будет выходить ежеквартально. В первом номере будет (должна быть) статья про скоринг - в том числе и по затронутым Yanochka вопросам. В частности там рассматривается (предлагается) вариант критерия принятия решения о целесообразности внедрения скоринговой системы - ясный день - далеко не исчераывающий, но все же - на основе "цен" ошибок 1-го и 2-го рода при классификации заемщиков (скоринге). Недолго осталось, надеюсь - уже ведь март...

        Комментарий


        • Всем привет.
          Кто может дать ответы на следующие вопросы или подсказать где можна об этом прочитать:
          1) В методических материалах указано, что неплохим вариантом для построения системы скоринга есть 2000 историй, из каких 50% - дефолт, 50 % - не дефолт. Какое объяснение этих цифр? Возможно ли построение системы в других соотношениях?

          2) Какие данные нежно брать для построения скоринговой системы: кредитные истории, что прошли весь цикл кредитования или кредитные истории строк которых 4-6 месяцев и которые еще не погашены? Учитывать ли кредити, которые были погашены досрочно? Нужно ли учитывать при построении системы скоринга инцеденты (непогашение ежемесячного платежа на протяжении 1-2 месяцев)?.

          3) Определение дефолта. Какие есть методы выбора оптимального определения дефолта (4 мес. или 90 дней как предлагает Базель)?

          Комментарий


          • Сообщение от v.pavlyuk
            Всем привет.
            Кто может дать ответы на следующие вопросы или подсказать где можна об этом прочитать:
            1) В методических материалах указано, что неплохим вариантом для построения системы скоринга есть 2000 историй, из каких 50% - дефолт, 50 % - не дефолт. Какое объяснение этих цифр? Возможно ли построение системы в других соотношениях?

            2) Какие данные нежно брать для построения скоринговой системы: кредитные истории, что прошли весь цикл кредитования или кредитные истории строк которых 4-6 месяцев и которые еще не погашены? Учитывать ли кредити, которые были погашены досрочно? Нужно ли учитывать при построении системы скоринга инцеденты (непогашение ежемесячного платежа на протяжении 1-2 месяцев)?.

            3) Определение дефолта. Какие есть методы выбора оптимального определения дефолта (4 мес. или 90 дней как предлагает Базель)?
            1 - Необходимая выборка для построения скоринг модели зависит от: а) кол-ва входных переменных б) применяемого алгоритма. в) распределения обуч. данных в выборке. Поэтому что то сказать сложно. Статистические методы (дискриминантный анализ, логистич.регрессия) требуют бОльших объемов выборки, чем методы Data Mining;

            2 - Это уже нужно решить Вам. Если данных по погашениям достаточно, то лучше брать только их. Если недостаточно, то можно брать историю первых погашений. И именно Вы должны выработать правила, каких заемщиков считать хорошими а каких - плохими (пример: задержка еж. платежа до 7 дней - все равно хороший и т.д.).

            3 - тут мне сказать нечего =)

            Комментарий


            • Сообщение от v.pavlyuk
              Всем привет.
              Кто может дать ответы на следующие вопросы или подсказать где можна об этом прочитать:
              1) В методических материалах указано, что неплохим вариантом для построения системы скоринга есть 2000 историй, из каких 50% - дефолт, 50 % - не дефолт.
              2) Какие данные нежно брать для построения скоринговой системы:
              3) Определение дефолта. Какие есть методы выбора оптимального определения дефолта (4 мес. или 90 дней как предлагает Базель)?
              1) Из нашего опыта - очень хорошая модель получается при 6000 историй, из которых 10% - дефолт. (Можно построить и на 3000, 300 дефолтников, соответственно).
              2) Тут уже зависит от Вас - можно построить и портрет задолжника и портрет дефолтника. Все зависит от количества Ваших данных.
              3) Политика Вашего Банка.

              Комментарий


              • to pnb and Alex101

                Спасибо за ответы.

                Еще один вопрос: возможно ли построить адекватную скоринговую модель, имея выборку 15000 историй из каких 4 % дефолты???
                Спасибо.

                Комментарий


                • Еще один вопрос: возможно ли построить адекватную скоринговую модель, имея выборку 15000 историй из каких 4 % дефолты???

                  А адекватную в каком смысле? Имеется ввиду точный смысл "адекватности". Вопрос не праздный. Как формировать обучающую выборку? Взять, к примеру, 600 дефолтных случаев унд 600 "хорошиХ" или же 14400 "хороших" и 600 дефолтных. Как будут различаться скоринговые системы построенные на таких разных обучающмх выборках?
                  Мне так кажется, что однозначного ответа нет. Тем более - для широкого (не ограниченного) набора алгоритмов.Если 50 на 50 - вроде оптимизируется "пороговое зрение", но система настраивается на работу как бы со смещенным "центром тяжести"- если в реальной выборке дефолтность на уровне 5-10%.
                  Это похоже на задачу определения необходимого объема выборки для оценки вероятности события - при равных требованиях по точности и надежности оценки максимальная выборка необходима для вероятности 0,5 (для нормального закона порядка 9800 реализаций при уровне значимости 0,95 и доверительном интервале 0, 01) и минимальная (3600) для вероятности 0,1).

                  Мне кажется, что точный ответ может дать только проверка на независимой выборке.

                  Комментарий


                  • Сообщение от v/pavlyuk
                    возможно ли построить адекватную скоринговую модель, имея выборку 15000 историй из каких 4 % дефолты???
                    Спасибо.
                    Все зависит от данных (за какой период эта выборка, являются ли все данные по одному продукту, региону и т.п.).
                    Но, по идее, модель получиться должна.
                    KXENу как раз не нужно 50 на 50 "хороших" и "плохих".

                    Комментарий


                    • to Alex101:

                      мне как говорят о построении моделей KXEN'ом, меня в дрожь бросает, ситуация на практике: обучающий набор 80% - хороших, 20% - плохих, стоят модель, точность на обучающем наборе - 82%. Ну ка , математики, если я закрою глаза и всех сразу обзову "хорошими", какая будет точность моего решения ?

                      to Risk & v/pavlyuk

                      такая несбалансированная выборка, где 4% плохих, если она является "отражением" кредитного порфеля может использоваться для построения модели и дальнейшей оценки её финансовой эффективности. Просто существуют много подходов как это делать.

                      to EugeniyR

                      На счет www.bns.com.ua, по моим последним сведениям, их купили серьезные американские товарищи - Scorto Corp. www.scorto.com, поэтому утверждение на счет их бизнеса, думаю, спорное. Что самое интересное - Scorto - это пока единственная контора, которая предлагает СПЕЦИАЛИЗИРОВАННОЕ ПО для скоринга. Во всяком случае, те вопросы, которые я им задавал четко расставили все точки над i.

                      to Risk
                      Если не секрет, какие АБС смотрели со встроенным скорингом?

                      Комментарий


                      • psch!

                        Пытался смотреть Diasoft Retail - там есть ... заставка с названием "Скоринг". Предлагал их представителям "наполнить" содержанием - так до сих пор размышляют и - ничего, никаких последствий... А ведь трудно переоценить перспективы данного рынка. Наверной, надо выбрать время и поговорить с другими АБСниками.
                        А может уже нам лавку создать самим, из форумян на эту тему?
                        Бухобслуживание - 300, нужен средний программер на неполный день. Все остальное - можем сами - и реклама через форум. На это все мона набрать денех (своих).

                        Комментарий


                        • На счет www.bns.com.ua, по моим последним сведениям, их купили серьезные американские товарищи - Scorto Corp. www.scorto.com, поэтому утверждение на счет их бизнеса, думаю, спорное. Что самое интересное - Scorto - это пока единственная контора, которая предлагает СПЕЦИАЛИЗИРОВАННОЕ ПО для скоринга. Во всяком случае, те вопросы, которые я им задавал четко расставили все точки над i.
                          Спасибо, за ссылку, посмотрел. Неубедительно. Посмотрите для сравнения http://www.salford-systems.com
                          Последний раз редактировалось EugeniyR; 30.04.2006, 01:00. Причина: оформление

                          Комментарий


                          • Сообщение от psch
                            to Risk
                            Если не секрет, какие АБС смотрели со встроенным скорингом?
                            Я работал с несколькими продуктами для data mining. Задача построения скоринга - лишь одна из задач, решаемых этими продуктами. Как я понимаю, АБС решают другие задачи. Универсальность тут врядли оправдана. Нужна открытая архитектура и надстройка.

                            Сравнение могу для наглядности такое привести: если нужно сделать дырку в бетоне, то можно купить набор инструментов от SAS (за $$$'$$$), а можно перфоратор (за $$$). Некоторым 6-ти значные суммы нравятся больше :-) Но дырку делать = скоринг встраивать, ИМХО самим придется.

                            Комментарий


                            • Сообщение от psch
                              to Alex101:
                              мне как говорят о построении моделей KXEN'ом, меня в дрожь бросает, ситуация на практике: обучающий набор 80% - хороших, 20% - плохих, стоят модель, точность на обучающем наборе - 82%. Ну ка , математики, если я закрою глаза и всех сразу обзову "хорошими", какая будет точность моего решения ?
                              Да вы не дрожите , а скажите лучше, что вы понимаете под точностью?
                              Наши клиенты не дрожат, а довольно улыбаются

                              Комментарий


                              • to Alex101
                                В контексте той ситуации под точностью понималось общее качество классификации хороших и плохих. Поэтому сразу возник вопрос, а сколько процентов хороших определилось правильно и сколько процентов плохих? Просьба показать Confusion matrix - выразила у Вас почему-то глубокое недоумение...

                                to EugeniyR
                                На счет SAS - полностью согласен.

                                Что касается Salford Systems, то здесь опять таки - непосредственно к скорингу они отношение не имеют, у них сильный математический аппарат в различных приложениях, НО... построение самой скоринговой модели - это еще не весь скоринг, еще её необходимо правильно оценить, проверить как она будет отрабатывать на кредитном портфеле, соответсвовать стратегии развития, оценить файтическую прибыль и уровень охвата рынка и т.п. (эти все задачи должны решаться на этапе построения и "подстройке" модели и для этого есть специальные "скоринговые" инструмены, а у Salford Systems это есть?)

                                После того как модель построена, необходимо правильно построить скоринговую инфраструктуру, поставить сервер принятия решений где эта модель (возможно не одна, а несколько) будут "крутиться". Потом праивильно выбрать точки интеграции с существующей банковской системой. После того как модель "начала работу" необходимо отслеживать её качество, эффективность, адекватность, субъективный фактор и т.д Опять таки - для этого существуют специальные скоринговые техники и методологии. (У Salford Systems это есть?)

                                Все вышеописанное есть у SAS, но...по моему мнению их решение слишком тяжеловесно и подходит действительно тольок для тех кому нравятся боооольшие суммы

                                Комментарий


                                • Сообщение от psch
                                  to Alex101
                                  В контексте той ситуации под точностью понималось общее качество классификации хороших и плохих. Поэтому сразу возник вопрос, а сколько процентов хороших определилось правильно и сколько процентов плохих? Просьба показать Confusion matrix - выразила у Вас почему-то глубокое недоумение...
                                  Странно, честное слово.
                                  Не могли бы в b-mail кинуть название банка, где это происходило...

                                  Комментарий


                                  • Сообщение от Alex101
                                    Странно, честное слово.
                                    ...
                                    Что "странно"? Значит у вас все таки есть Confusion matrix?

                                    Вы мне лучше подскажите одну вещь, меня в последнее время мучает следующий вопрос - модель мы строим на наборе 50%хор/50%плох, но в действительности же хороших больше, надо ли как-то изменять модель с этими условиями?

                                    Комментарий


                                    • Сообщение от psch
                                      Что "странно"? Значит у вас все таки есть Confusion matrix?
                                      Именно самой матрицы нет, но мы для одного банка сделали отчет в Excel, на базе которого и показываем ошибки 1-го и 2-го рода в зависимости от балла отсечения.

                                      Сообщение от psch
                                      Вы мне лучше подскажите одну вещь, меня в последнее время мучает следующий вопрос - модель мы строим на наборе 50%хор/50%плох, но в действительности же хороших больше, надо ли как-то изменять модель с этими условиями?
                                      Да в том-то все и дело, что не надо 50% на 50%, иначе моделирование уже получается на искусственных данных. Мы данные берем реальные.
                                      Конечно, для хорошей скоринговой модели надо 3000-6000 анкет, из которых "плохих" процентов 10, ну и параметров - чем больше, тем лучше.

                                      Комментарий


                                      • Уважаемые!

                                        А кто 26 мая пойдет в Диасофт на семинар по современным розничным технологиям? А? Там кстати участие Scorto заявлено. Кстати, можно было бы многое очно и обсудить. Я планирую.

                                        Комментарий


                                        • Сообщение от Alex101
                                          Да в том-то все и дело, что не надо 50% на 50%, иначе моделирование уже получается на искусственных данных. Мы данные берем реальные.
                                          ...хм.... ну мы опять возвращаемся к ситуации, когда на обучающем наборе, где 90%хор/10%плох, алгоритм просто "не заметит" плохих, а всех обзовет хорошими, общая точность такого решения модели будет 90%... ну это же скорее всего неправильный подход, верно ?

                                          ....и как быть в такой ситуации ?

                                          Комментарий


                                          • Сообщение от psch
                                            ...хм.... ну мы опять возвращаемся к ситуации, когда на обучающем наборе, где 90%хор/10%плох, алгоритм просто "не заметит" плохих, а всех обзовет хорошими, общая точность такого решения модели будет 90%... ну это же скорее всего неправильный подход, верно ?

                                            ....и как быть в такой ситуации ?
                                            Если будет 300-500 "плохих", то заметит.
                                            У нас замечает.
                                            Можно проверить на практике.

                                            Комментарий


                                            • Уважаемые коллеги!
                                              Очень нужно знать какие все-таки цифры скрываются за "$$$'$$$", упомянутыми в отношении скоринговых решений SAS??
                                              Поиск стоимости услуг на скоринговые программы не увенчался положительным результатом, нужны конкретные цифры!! поделитесь такой инфой, если возможно. надеюсь это не секрет..

                                              Комментарий


                                              • В основе любой скоринговой системы должен быть мат аппарат :-) хотя правильнее это назвать прикладной статистикой. Нужно ли платить за интерфейсы, предлагаемые "скоринговыми" решениями, наверное следует спросить руководителя отдела программного обеспечения. Это зависит от того как предполагается использовать систему. Думаю, никто не захочет доверить решение вопросов черному ящику.

                                                CART строит скоринговую модель в виде логических правил написанных в программном коде (С, SQL и др.) Это обеспечивает прозрачность. Банковские программисты могут легко встроить код в существующую систему или написать требующиеся надстройки.

                                                Программный продукт от Salford Systems стоит в районе пяти сотен, от SAS до сотен тысяч (зависит от комплектации). Надо писать письма чтобы о ценах узнать. Плюс добавьте затраты на обучение сотрудника основам Data Mining чтобы квалифицированно инструментом пользоваться. Плюс затраты на внедрение и т.п.

                                                Комментарий


                                                • KXEN дешевле и проще.

                                                  Комментарий


                                                  • to Alex101
                                                    ...а какие у Вас есть возможности по "использованию" созданной скоринговой модели в информационной инфраструктуре?

                                                    Комментарий


                                                    • Сообщение от psch
                                                      to Alex101
                                                      ...а какие у Вас есть возможности по "использованию" созданной скоринговой модели в информационной инфраструктуре?
                                                      Что Вы понимаете под "использованием"?
                                                      Если интеграция модели в ПО, то модель экспортируется на любые (из мне знакомых) языки программирования.

                                                      Комментарий


                                                      • to Alex101
                                                        Ну... например Вы в добавок к модели хотите "повесить" некоторые правила, которые бы выдавали сообщения для помощи в принятии решения на основе скоринга... например - если "возраст" до 23 лет + нестабильные источники доходов + срок кредита до 16 мес, то отправить на доп. рассмотрение и проработку...

                                                        Комментарий


                                                        • Сообщение от psch
                                                          to Alex101
                                                          Ну... например Вы в добавок к модели хотите "повесить" некоторые правила, которые бы выдавали сообщения для помощи в принятии решения на основе скоринга... например - если "возраст" до 23 лет + нестабильные источники доходов + срок кредита до 16 мес, то отправить на доп. рассмотрение и проработку...
                                                          Да! Очень хороший вопрос! Этто как раз реализовано в нашей системе K4Loans.
                                                          Есть скоринг-модель, есть методики, которые также настраиваются (причем это не прерогатива разработчика, а доступно пользователям системы).
                                                          Причем настройка методики позволяет принимать решения на различных этапах прохождения анкет.
                                                          Методика не только есть сама по себе, но существует еще привязка к регионам/отделениям, прдуктам. Есть общая методика, которая может быть подстроена для конкретных филиалов/продуктов (структура которых тоже настраивается пользователем).
                                                          + Есть стыковка с внешними проверочными базами данных (не буду говорить какими).
                                                          Если Вам это интересно, то можно встретиться (даже неформально), я покажу как это все работает.

                                                          Комментарий


                                                          • to Alex101
                                                            вопрос напрямую - чем вы лучше Experian ?

                                                            Комментарий


                                                            • Сообщение от psch
                                                              to Alex101
                                                              вопрос напрямую - чем вы лучше Experian ?
                                                              Уж какой-то слишком прямой вопрос, но постараюсь ответить
                                                              Отвечу по нашему общему решению (компания "Ксема") K4Loans+KXEN.

                                                              1. Полностью автоматизированный фронт-офис с различными настройками фильтров, методик, кредитных продуктов, прав пользователей с интегрированным аналитическим модулем.
                                                              2. Модели строите Вы сами, причем обновляете с какой угодно частотой, моделей может быть сколько угодно.
                                                              3. Приобретая в качестве аналитического модуля KXEN, Вы можете использовать моделирование для решения как смежных задач (работа с "плохими" долгами, сегментация клиентской базы и т.д.), так и для других задач (борьба с мошенничеством в пластике, маркетинговый анализ, оптимизация маркетинговых кампаний, предотвращение оттока клиентов, оптимизация загрузки денег в банкоматы и т.д.).
                                                              4. Цена.
                                                              5. В Северной Европе Experian уже использует KXEN.

                                                              Комментарий

                                                              Пользователи, просматривающие эту тему

                                                              Свернуть

                                                              Присутствует 1. Участников: 0, гостей: 1.

                                                              Обработка...
                                                              X