Этот сайт использует Яндекс.Метрику для анализа посещаемости. Подробнее
Очистка и Power Query

Нечеткое слияние в Power Query: как сопоставить данные с ошибками в Excel

forest_paw 06.09.2025 28

Нечеткое слияние в СТЕПЕНЬ (Power) Query: как сопоставить данные с ошибками в Excel

Когда стандартные функции Excel, такие как ВПР (VLOOKUP) или ПРОСМОТРХ (XLOOKUP), не справляются из-за различий в форматах данных, на помощь приходит нечеткое слияние (Fuzzy ПОИСКПОЗ (Match)) в СТЕПЕНЬ (Power) Query. Этот мощный инструмент позволяет находить соответствия даже при наличии опечаток, разных форматов имен или сокращений.

Рассмотрим типичный кейс: у вас есть два списка сотрудников — один официальный (Фамилия, Имя), а второй — с данными по формам, где имена могут быть записаны неформально или с ошибками. Задача — найти, кто не сдал форму.

Столбец A содержит Фамилию, Имя. Столбец D содержит Имя Фамилия. Дополнительная таблица в столбцах G и H показывает синонимы. Например, Edward и Ed — это одно и то же. Emmanuelle и Manny — это одно и то же.
Столбец A содержит Фамилию, Имя. Столбец D содержит Имя Фамилия. Дополнительная таблица в столбцах G и H показывает синонимы. Например, Edward и Ed — это одно и то же. Emmanuelle и Manny — это одно и то же.

Для повышения точности сопоставления используется таблица преобразований (например, «William» → «Bill»). Все исходные диапазоны данных необходимо сначала преобразовать в таблицы Excel, нажав Ctrl + Т (T).

Пошаговая инструкция по настройке нечеткого слияния

  1. Создайте подключения в СТЕПЕНЬ (Power) Query. Для каждой таблицы (например, «Census», «Forms», «Nicknames») выберите ячейку внутри нее, перейдите на вкладку «Данные» → «Из таблицы/диапазона». В редакторе СТЕПЕНЬ (Power) Query нажмите «Закрыть и загрузить в…» и выберите «Только создать подключение».
В редакторе Power Query на вкладке 'Главная' первая кнопка — 'Закрыть и загрузить'. Нижняя часть кнопки — раскрывающееся меню. Выберите 'Закрыть и загрузить в...', чтобы открыть диалоговое окно 'Импорт данных'.
В редакторе СТЕПЕНЬ (Power) Query на вкладке 'Главная' первая кнопка — 'Закрыть и загрузить'. Нижняя часть кнопки — раскрывающееся меню. Выберите 'Закрыть и загрузить в...', чтобы открыть диалоговое окно 'Импорт данных'.
Первые четыре варианта в диалоговом окне 'Импорт данных': 'Таблица', 'Сводная таблица', 'Сводная диаграмма', 'Только создать подключение'. В данном случае выберите 'Только создать подключение'.
Первые четыре варианта в диалоговом окне 'Импорт данных': 'Таблица', 'Сводная таблица', 'Сводная диаграмма', 'Только создать подключение'. В данном случае выберите 'Только создать подключение'.

После создания всех трех подключений они появятся на панели «Запросы и подключения» как «Только подключение».

На панели 'Запросы и подключения' перечислены три запроса типа 'Только подключение': Census, Forms и Nicknames.
На панели 'Запросы и подключения' перечислены три запроса типа 'Только подключение': Census, Forms и Nicknames.
  1. Запустите слияние. Выберите пустую ячейку, перейдите «Данные» → «Получить данные» → «Объединить запросы» → «Слияние».
  2. Настройте диалоговое окно «Слияние».
    • Выберите первую таблицу (например, «Census») и ключевое поле (например, «Employee Name»).
    • Выберите вторую таблицу (например, «Forms») и соответствующее ключевое поле (например, «Name»).
    • Для «Тип соединения» выберите «Левое внешнее (все из первой, соответствующие из второй)».
    • Установите флажок «Использовать нечеткое соответствие для выполнения слияния».
Диалоговое окно 'Слияние' с множеством настроек: выбор таблиц, полей, типа соединения 'Левое внешнее', включение нечеткого соответствия, настройка порога сходства (по умолчанию 0.8), выбор таблицы преобразований Nicknames.
Диалоговое окно 'Слияние' с множеством настроек: выбор таблиц, полей, типа соединения 'Левое внешнее', включение нечеткого соответствия, настройка порога сходства (по умолчанию 0.8), выбор таблицы преобразований Nicknames.
  1. Настройте параметры нечеткого соответствия. Раскройте меню «Параметры нечеткого соответствия». Ключевые настройки:
    • Порог сходства: По умолчанию 0.8 (80%). Можно уменьшить до 0.7 или 0.6 для большего числа совпадений, но осторожно — слишком низкое значение может привести к ложным срабатываниям.
    • Таблица преобразований: Укажите таблицу с синонимами (например, «Nicknames»).
  2. Нажмите «ОК». В редакторе СТЕПЕНЬ (Power) Query появится новая таблица. Щелкните значок развертывания (две стрелки) в столбце «Forms», чтобы выбрать, какие поля из второй таблицы добавить в результат. Снимите флажок «Использовать исходное имя столбца в качестве префикса», чтобы избежать длинных имен.
Результат в редакторе Power Query: три столбца. В столбце Forms в каждой строке указано 'Таблица'. Используйте значок развертывания справа от заголовка Forms, чтобы выбрать поля для отображения, например, Names и Forms Received Date.
Результат в редакторе СТЕПЕНЬ (Power) Query: три столбца. В столбце Forms в каждой строке указано 'Таблица'. Используйте значок развертывания справа от заголовка Forms, чтобы выбрать поля для отображения, например, Names и Forms ПОЛУЧЕНО (Received) ДАТА (Date).
  1. Нажмите «Главная» → «Закрыть и загрузить», чтобы вывести итоговую таблицу на новый или существующий лист.
Результат сопоставления. Ed Ackman сопоставлен с Ackman, Edward. Несколько сотрудников все еще не сопоставлены.
Результат сопоставления. Ed Ackman сопоставлен с Ackman, Edward. Несколько сотрудников все еще не сопоставлены.

Советы и проверка результатов

Проверка на ложные срабатывания: После получения результатов внимательно их проверьте. Для поиска записей во второй таблице, которые не попали в слияние, выполните еще одно слияние, поменяв таблицы местами и выбрав тип соединения «Левая анти-полусоединение (только строки из первой таблицы)».

Настройка точности: Экспериментируйте с «Порогом сходства». Более низкое значение найдет больше совпадений, но повысит риск ошибок.

Автоматизация: По мере поступления новых данных просто используйте «Данные» → «Обновить все», чтобы автоматически перезапустить процесс нечеткого слияния с обновленными списками.

Заключение

Несмотря на кажущуюся сложность, нечеткое слияние в СТЕПЕНЬ (Power) Query — это незаменимый инструмент для работы с «грязными» данными, где точное совпадение невозможно. Он экономит часы ручной работы по сверке списков с опечатками, разными форматами имен или сокращениями, обеспечивая гибкость и возможность автоматической актуализации результатов.

Поделиться:

Похожие статьи

Data From Picture: почему эта функция Excel не готова для реального использования
Читать
Очистка данных в Excel с помощью Power Query: полное руководство
Читать
Очистка данных с помощью Copilot в Excel: как использовать AI для наведения порядка в таблицах
Читать

Мы используем cookies для улучшения работы сайта. Продолжая использовать сайт, вы соглашаетесь с политикой использования cookies.