23 октября, вторник 23:15
Bankir.Ru

Объявление

Свернуть
Пока нет объявлений.

Преобразование адресов.

Свернуть
X
  • Фильтр
  • Время
  • Показать
Очистить всё
новые сообщения

  • Преобразование адресов.

    Народ, наверное не сюда пишу, но есть предложение.
    Наверное у многих сложилась такая ситуация, что в базах достаточно много адресов, которые представлены в неформализованном виде, и их нужно представить в нормальном виде. Да за примером далеко ходить не надо, тот же реестр обязательств требует адреса представленные по КЛАДРу.
    Так вот о чем я, хочу предложить набор скриптов, которые обрабатывают данные КЛАДР, и уже с имеющимся набором данных работают для формирования нормального адреса.
    Скрипты работают на MSSQL 2000 и 2005 (последний предпочтительнее в плане скорости работы).
    Есть заинтересованные лица?

    ЗЫЖ В случае чего есть табличка, в которой указываются приоритеты по разбору адресов. Для Москвы она уже настроена, для СПб настраивается путем замены одних значений приоритетов на более высокие по отношению к Москве

    ЗЗЫЖ На днях попробую вуложить вэб форму по корректировке и вы сами оцените качество разбора данных.

  • #2
    Наверное, предложение будет интересно только тем, кто еще :
    - не вошел, но по каким-то причинам старается попасть в систему страхования вкладов,
    - не отправляет(или отправляет в кривом формате) данные по заемщикам в БКИ,
    - не отправляет(или отправляет в кривом формате) данных по счетам в налоговые...
    Остальным оно, скорее всего, уже давно не нужно.

    Комментарий


    • #3
      Сообщение от _trouble_ Посмотреть сообщение
      ...
      Так вот о чем я, хочу предложить набор скриптов, которые обрабатывают данные КЛАДР, и уже с имеющимся набором данных работают для формирования нормального адреса.
      Скрипты работают на MSSQL 2000 и 2005 (последний предпочтительнее в плане скорости работы).
      За деньги?
      А ашипки и сокр. понимает?
      Сообщение от _trouble_ Посмотреть сообщение
      ЗЫЖ В случае чего есть табличка, в которой указываются приоритеты по разбору адресов.
      Уууу. Какие приоритеты? Нечеткий поиск решает задачу с довольно высокой достоверностью. Без приоритетов. А если еще и обучаться умеет...

      Сообщение от _trouble_ Посмотреть сообщение
      ЗЗЫЖ На днях попробую вуложить вэб форму по корректировке и вы сами оцените качество разбора данных.
      Это дело. Поглядеть можно. Но должна быть возможность ввести произвольный адрес, который система должна разобрать.

      Комментарий


      • #4
        Программа контроля реестра обязательств достаточно хорошо справляется с разбором адресов (с маленьким процентом недоразумений..).

        Комментарий


        • #5
          Сообщение от ezhikov Посмотреть сообщение
          Программа контроля реестра обязательств достаточно хорошо справляется с разбором адресов (с маленьким процентом недоразумений..).
          Это та, что на сайте Агенства?

          Комментарий


          • #6
            IgorL
            она самая, хотя в закромах Агентства давно уже тестируется версия поновее... разбирает она еще лучше...

            Комментарий


            • #7
              Ну, подождем тогда выхода новой чекалки.
              Просто та чекалка, что у них лежит, очень любит чудить.
              Ряд адресов коверкает до неузноваимости.
              Вполне корректный адрес, но не верный индекс, она предлагает исправить на правильный. Это круто. Но после подпихивания ей уже правильного адреса с индексом, который предложила чекалка, имеем другую улицу.
              Потом замечательный адрес есть: 2-я Тверская Ямская дом-корп-кв. Эта чекалка почему-то решает, что это Тверская Область и какая-то деревня Ямская в этой области.

              А нам дают адреса в ехеле и просят их привести в нормальный вид. Чекалка посылала в 99% с криками, что не может распознать адрес.

              На выходных появится формочка в вэбе и адресок скину. Надеюсь, что мне эту формочку сделают

              Комментарий


              • #8
                _trouble_
                очень интересно увидеть это список адресов, 99% которых программа не смогла разобрать
                Потом замечательный адрес есть: 2-я Тверская Ямская дом-корп-кв. Эта чекалка почему-то решает, что это Тверская Область и какая-то деревня Ямская в этой области
                ну в общем-то имхо правильно предложила программа

                Комментарий


                • #9
                  Вот ведь - придумают себе проблемы, всякие кладры, а потом героически с ними борятся. Обидно, что придумывают одни, а бороться приходится совсем другим.

                  Умные люди уже давно поняли, что адрес формализовать невозможно. Ну страна, зип, может быть, город. Остальное - плэйнтекстом.
                  На западе есть еще всякие "боро", "каунти", вместо номера дома его Имя (Trump Building).
                  Возьмите справочник банков с swift.com/biconline. Там адрес замечательно отформатирован - line1, lime2, line3, line4.
                  Чтобы на конверте было удобно напечатать.

                  Комментарий


                  • #10
                    2 st@p Умные люди уже давно поняли, что адрес формализовать невозможно
                    А можно поподробнее... до умного хочу дорасти.
                    "Единственный способ научиться играть лучше - играть с более сильным соперником!"

                    Комментарий


                    • #11
                      2 st@p
                      Тогда уж надо говорить, что умные люди давно придумали идентификатор физического лица, который действует и не меняется с рождения и до смерти. А у нас с этим глобальные проблемы, вот и приходится пытаться идентифицировать конкретного физика по куче полей. И ессно если эти поля формализованы - идентификация более надежна.
                      А по сути - КЛАДРизацию адресов прошли, что смогли - обработали автоматом, остальное (около 10%) выдали на ручную корректировку. И к КЛАДРу имеем только одну претензию - никто за его корректность и актуальность не отвечает. Обновляется он слишком редко и довольно часто адрес есть, а КЛАДР о нем не в курсе.
                      Serg Voronov

                      Комментарий


                      • #12
                        Вот с этим полностью согласен.
                        Последний КЛАДР, который смог найти, датирован 27 декабря, а выложен был 15 января этого года.

                        Комментарий


                        • #13
                          Возможно у кого-то есть скрипт, который по адресу позволяет определить почтовый индекс, поделитесь пожалуйста.

                          Комментарий


                          • #14
                            _trouble_
                            Это не то, чем http://www.hflabs.ru/technical.htm занимается?

                            Комментарий


                            • #15
                              Vlad.S
                              позволяет определить почтовый индекс
                              сильно... вплоть до почтового отделения?

                              а у нас все изначально построено по кладру. и никаких проблем.
                              Жить надо так, чтоб тебя помнили сволочи!

                              Комментарий


                              • #16
                                Сообщение от alanf Посмотреть сообщение
                                Vlad.S
                                позволяет определить почтовый индекс
                                сильно... вплоть до почтового отделения?
                                а у нас все изначально построено по кладру. и никаких проблем.
                                так индекс вроде и содержит номер почтового отделения
                                для адреса "Москва г, 1812 года ул" индекс (121170) определяется без вопросов и нами, и нашим производителем абс, и производителями тех абс, которые я видел (не очень много)... а с адресом "Москва г, 1905 года ул" встает вопрос, индекс (123022 или 123100) зависит от номера дома...
                                вот скрипт обрабатывающий данную ситуацию и хочется увидеть, чтобы не изобретать свой велосипед

                                Комментарий


                                • #17
                                  Vlad.S Возможно у кого-то есть скрипт, который по адресу позволяет определить почтовый индекс, поделитесь пожалуйста.
                                  У меня это сделано на РСЛ. Подойдет?
                                  В каждой программе есть по крайней мере одна ошибка

                                  Комментарий


                                  • #18
                                    Vlad.S кусочек ГИС практически )))
                                    Жить надо так, чтоб тебя помнили сволочи!

                                    Комментарий


                                    • #19
                                      Сообщение от Big_Mike Посмотреть сообщение
                                      Vlad.S Возможно у кого-то есть скрипт, который по адресу позволяет определить почтовый индекс, поделитесь пожалуйста.
                                      У меня это сделано на РСЛ. Подойдет?
                                      Спасибо! Давайте посмотрю, если не пойму что-то, то можно ли надеется на пояснение?

                                      Комментарий

                                      Пользователи, просматривающие эту тему

                                      Свернуть

                                      Присутствует 1. Участников: 0, гостей: 1.

                                      Обработка...
                                      X