데이터 요구 사항 정의는 다른 어느 단계보다 중요한데 이 단계에서 앞으로 무엇을 어떻게 할 것인지 윤곽을 확실히 잡게 됩니다. 요구 사항은 당연히 요구하는 측에서 제시해야 하는데 즉, 사업을 의뢰한 고객 측에서 자신들이 하고 싶은 것을 요구해야 수행 측에서 그 일을 어떻게 하겠다는 생각을 할 수 있습니다. 요구 사항 정의에서 나와야 하는 산출물은 이행 대상 테이블 정의(테이블명, 데이터 건수, 데이터의 양), 변환 또는 정제 대상 정의(XX 코드 변환, 문자 컬럼의 일자 형태 정제 등), 목표 이행 시간(시스템 다운 후 몇 시간 이내 이행 완료), 이행 환경(이행을 위한 주어진 시스템(CPU/DISK, DB 종류, CharacterSet, Version), 작업 시간대(개발 및 테스트 시간대 등)가 있습니다. 실제 프로젝트 수행 시 변환 및 정제 대상 정의를 프로젝트 초기에 제시하는 고객은 거의 없습니다. 무엇을 정제할 것인지를 알기 위해선 데이터 품질 검사가 우선돼야 합니다. 서로의 편의를 위해 수행 측에서 프로젝트 초기에 수고를 좀 더 해 데이터 품질 검사를 실시하고 그 결과를 이용해 데이터 정제 요구 사항으로 사용한다면 고객 측과 수행 측 쌍방에 도움될 것입니다.