
세일즈포스를 운영하다 보면 어느 순간 데이터의 신뢰도가 떨어지는 시점을 마주하게 됩니다. 분명히 어제 등록한 고객인데 오늘 다른 직원이 똑같은 정보를 또 등록하거나, 마케팅 이메일을 보냈는데 동일 인물에게 두 번 발송되어 항의를 받는 상황이 대표적입니다. 데이터가 쌓이는 속도보다 중복 데이터가 쌓이는 속도가 빠르면 세일즈포스는 단순한 데이터 쓰레기통으로 전락하고 맙니다. 오늘은 관리자의 숙명과도 같은 데이터 품질 관리, 그중에서도 중복 규칙 설정을 통한 데이터 클렌징 전략을 심도 있게 다루어 보겠습니다.
중복 데이터 관리의 두 기둥: 일치 규칙과 중복 규칙
세일즈포스에서 중복을 제어하기 위해서는 두 가지 개념을 명확히 구분해야 합니다. 바로 일치 규칙(Matching Rules)과 중복 규칙(Duplicate Rules)입니다.
일치 규칙은 무엇을 중복으로 볼 것인가에 대한 기준을 정의합니다. 예를 들어 이름과 전화번호가 같으면 중복으로 간주할지, 혹은 이메일 주소만 같아도 중복으로 볼지를 결정하는 엔진 역할을 합니다. 반면 중복 규칙은 그 기준에 부합하는 중복 데이터가 발견되었을 때 어떤 행동을 취할지를 정의합니다. 사용자에게 경고 메시지만 보여주고 저장을 허용할 것인지, 아니면 아예 저장을 차단할 것인지를 설정하는 제어 장치라고 이해하면 쉽습니다.
퍼지 매칭(Fuzzy Matching)으로 영문명 중복까지 잡아내기
한국 기업에서 세일즈포스를 사용할 때 가장 골치 아픈 점은 이름 표기 방식의 다양성입니다. 영업사원 A는 홍길동으로 입력하고, 영업사원 B는 HONG GILDONG으로 입력하는 경우가 빈번합니다. 이때 필요한 것이 바로 퍼지 매칭 기술입니다.
세일즈포스의 일치 규칙 설정 시 Match Method를 Exact(정확히 일치)가 아닌 Fuzzy(유사 일치)로 설정하면 시스템은 알고리즘을 통해 비슷한 발음이나 오타가 포함된 데이터까지 검색합니다. 예를 들어 필드 설정에서 First Name을 Fuzzy: First Name으로 설정하면 Robert와 Bob을 같은 인물로 인식하거나, 주소지에서 Street와 St.를 동일하게 간주하여 중복을 찾아냅니다. 이는 수동으로 데이터를 일일이 대조하던 시간을 획기적으로 줄여주는 고급 테크닉입니다.
중복 데이터 병합(Merge) 프로세스 실무 팁
중복 규칙을 설정하기 전에 이미 쌓여버린 데이터들은 어떻게 해야 할까요? 세일즈포스는 레코드 병합 기능을 제공합니다. 중복된 레코드를 최대 3개까지 선택하여 하나로 합치는 과정인데, 이때 어떤 레코드를 마스터(Master)로 둘 것인지 결정하는 것이 중요합니다.
병합 시 각 필드별로 가장 최신 정보나 정확한 정보를 선택하여 최종 레코드를 구성할 수 있습니다. 주의할 점은 병합이 완료되면 하위 레코드는 삭제 처리된다는 것입니다. 다만 해당 레코드에 연결되어 있던 활동 내역이나 기회(Opportunity) 데이터는 자동으로 마스터 레코드로 이전되므로 데이터 유실 걱정은 덜 수 있습니다.
효율적인 중복 관리 전략 예시
가상의 영업팀 시나리오를 통해 최적의 설정을 설계해 보겠습니다. 신규 리드(Lead)가 유입될 때 이메일 주소가 동일한 레코드가 이미 존재한다면 시스템이 다음과 같이 반응하도록 설정할 수 있습니다.
먼저 일치 규칙에서 Email 필드를 정확히 일치로 설정합니다. 그다음 중복 규칙에서 Create(생성) 시 Action을 Block(차단)으로 설정하고, 사용자가 실수를 인지하도록 중복된 데이터가 이미 존재합니다라는 메시지를 띄웁니다. 이렇게 하면 데이터 유입 단계에서부터 중복을 원천 봉쇄할 수 있습니다. 반면 기존 데이터를 대량으로 수정하는 Update 상황에서는 차단보다는 Alert(경고)만 띄워 업무 흐름이 끊기지 않게 조절하는 유연함이 필요합니다.
세일즈포스 중복 규칙 관련 자주 묻는 질문 FAQ
Q1. 중복 규칙을 설정했는데 왜 기존에 있던 중복 데이터는 자동으로 합쳐지지 않나요?
세일즈포스의 중복 규칙은 기본적으로 레코드가 생성되거나 수정되는 시점에 작동하는 실시간 트리거 방식입니다. 이미 데이터베이스에 존재하는 과거의 중복 데이터를 한꺼번에 찾아내어 합쳐주는 기능은 아닙니다. 과거 데이터를 정리하려면 중복 보고서(Duplicate Record Reports)를 생성하여 리스트를 확보한 뒤 수동으로 병합하거나, 별도의 데이터 클렌징 툴을 사용하여 대량으로 정리해야 합니다.
Q2. 일치 규칙에서 퍼지 매칭을 사용하면 정확도가 떨어지지 않을까요?
퍼지 매칭은 세일즈포스 내부의 정교한 확률 알고리즘을 사용하지만, 간혹 이름이 아주 유사한 다른 사람을 중복으로 오인할 가능성도 있습니다. 이를 방지하기 위해 이름(Fuzzy)과 전화번호(Exact) 혹은 이름(Fuzzy)과 회사명(Exact) 처럼 최소한 하나의 필드는 정확히 일치해야 한다는 조건을 조합하는 것이 실무적인 정석입니다. 이렇게 여러 필드를 조합하면 오탐률을 낮추면서도 중복 검색 범위는 넓힐 수 있습니다.
Q3. 중복 규칙을 차단(Block)으로 설정했을 때 데이터 로더로 대량 업로드하면 어떻게 되나요?
데이터 로더(Data Loader)나 API를 통해 대량으로 데이터를 넣을 때도 중복 규칙은 작동합니다. 만약 규칙이 Block으로 설정되어 있다면 중복으로 판명된 행(Row)들은 업로드에 실패하고 에러 로그에 중복 오류가 기록됩니다. 대규모 데이터 이관 작업을 할 때는 잠시 중복 규칙을 비활성화하거나, 중복 규칙 옵션에서 Bypass(우회) 설정을 활용하여 작업을 마친 후 다시 켜는 전략이 필요합니다.
데이터 품질은 관리자의 지속적인 관심에서 나옵니다
중복 규칙 설정은 한 번의 클릭으로 끝나는 작업이 아닙니다. 비즈니스 상황에 맞게 일치 규칙의 임계값을 조정하고, 현업 사용자들이 불편함을 느끼지 않는 선에서 차단과 경고의 수위를 조절하는 과정이 반복되어야 합니다. 데이터가 깨끗해지면 보고서의 정확도가 올라가고, 이는 곧 경영진의 올바른 의사결정으로 이어집니다. 오늘 공유한 일치 규칙과 중복 규칙의 메커니즘을 이해하고 여러분의 조직에 맞는 최적의 데이터 방어선을 구축해 보시기 바랍니다. 다음 포스팅에서는 중복 데이터를 넘어 데이터의 가독성을 높이는 필드 표준화 전략에 대해 다루어 보겠습니다.