PostgreSQL) 모든 테이블에서 특정 값 찾기

작성: 2021.10.08

수정: 2023.04.11

읽는시간: 06 분

모든 테이블 찾기

특정 값을 검색 할 때, 모든 테이블에서 찾아봐야 할 경우가 종종 있습니다.

이번에 특정 데이터의 완전 삭제 기능을 구현하고 있었는데 모든 테이블을 FK로 연결한 건 아니라서 관련된 데이터들이 모두 삭제 되었는지가 확실하지 않았습니다.

FK 와 cascade 를 활용해서 싹 다 지워버리면 편하기야 하겠지만 의도치 않은 사이드이펙트가 나올 수도 있습니다. 특정 데이터를 삭제 할 경우 관련된 데이터를 무작정 제거하는게 아닌 다른 비즈니스 로직을 수행해야 하는 경우도 있을 수 있고, 실제로 데이터를 지우지 않고 상태만 변경해야 할 경우도 있습니다.

클라이언트의 요구사항은 다양하기 때문에 한가지 방법만을 고집 할 수는 없습니다. 비관계형 데이터베이스까지 커버해야 할 경우마저 있네요. Guava의 Event Bus를 사용해 비즈니스 로직과 후 처리 로직을 분리하는 아주 좋은 방법을 쓰면 Open-Closed Principle을 따르는 깔끔한 코드를 작성 할 수도 있습니다.

모든 데이터 베이스를 한번에 뒤지는 방법에는 두가지 방법이 있습니다.

데이터베이스 전체 덤핑 한 뒤 greb 을 이용해 찾기
function 만들어 찾기

검색 할 때마다 데이터베이스 컨텐츠를 덤핑하기엔 그닥 효율적이지 않습니다. 고맙게도 stack overflow에서 우리를 위해 pl/sql function 을 만들어 둔 개발자가 있어 우리는 가져다 쓰기만 하면 됩니다.

1. 데이터베이스 전체 덤핑한 후 grep 하기


bash
$ pg_dump --data-only --inserts -U postgres your-db-name > a.tmp
$ grep United a.tmp
INSERT INTO countries VALUES ('US', 'United States');
INSERT INTO countries VALUES ('GB', 'United Kingdom');

같은 기능이지만 --inserts 를 --coloum-inserts 로 변경 하면 컬럼명을 출력 결과에 포함 시킬 수 있습니다. 이 경우에는 특정 컬럼 이름으로 검색 할수도 있습니다만, 컬럼명을 찾을 목적이라면 data 대신 schema를 덤프 하는게 낫겠습니다.


bash
$ pg_dump --data-only --column-inserts -U postgres your-db-name > a.tmp
$ grep country_code a.tmp
INSERT INTO countries (iso_country_code, iso_country_name) VALUES ('US', 'United  States');
INSERT INTO countries (iso_country_code, iso_country_name) VALUES ('GB', 'United Kingdom');

2. function 만들어 찾기

개인적으로 이 함수를 정말 자주 호출해서 사용 하고 있습니다. 한번 추가해두면 함수만 호출해 사용하면 되기 때문에 간단합니다.


sql
CREATE OR REPLACE FUNCTION search_columns(
    needle text,
    haystack_tables name[] default '{}',
    haystack_schema name[] default '{}'
)
RETURNS table(schemaname text, tablename text, columnname text, rowctid text)
AS $$
begin
  FOR schemaname,tablename,columnname IN
      SELECT c.table_schema,c.table_name,c.column_name
      FROM information_schema.columns c
        JOIN information_schema.tables t ON
          (t.table_name=c.table_name AND t.table_schema=c.table_schema)
        JOIN information_schema.table_privileges p ON
          (t.table_name=p.table_name AND t.table_schema=p.table_schema
              AND p.privilege_type='SELECT')
        JOIN information_schema.schemata s ON
          (s.schema_name=t.table_schema)
      WHERE (c.table_name=ANY(haystack_tables) OR haystack_tables='{}')
        AND (c.table_schema=ANY(haystack_schema) OR haystack_schema='{}')
        AND t.table_type='BASE TABLE'
  LOOP
    FOR rowctid IN
      EXECUTE format('SELECT ctid FROM %I.%I WHERE cast(%I as text)=%L',
       schemaname,
       tablename,
       columnname,
       needle
      )
    LOOP
      -- 더 자세한 결과를 받아보기 위해서는 아래 줄의 주석을 제거해주세요.
      -- RAISE NOTICE 'hit in %.%', schemaname, tablename;
      RETURN NEXT;
    END LOOP;
 END LOOP;
END;
$$ language plpgsql;

사용법

public schema의 모든 테이블에서 조회하기:


sql
select * from search_columns('foobar');
 schemaname | tablename | columnname | rowctid 
------------+-----------+------------+---------
 public     | s3        | usename    | (0,11)
 public     | s2        | relname    | (7,29)
 public     | w         | body       | (0,2)
(3 rows)

특정 테이블에서 조회하기:


sql
 select * from search_columns('foobar','{w}');
 schemaname | tablename | columnname | rowctid 
------------+-----------+------------+---------
 public     | w         | body       | (0,2)
(1 row)

특정 테이블 집합에서 조회하기:


sql
select * from search_columns('foobar', array(select table_name::name from information_schema.tables where table_name like 's%'), array['public']);
 schemaname | tablename | columnname | rowctid 
------------+-----------+------------+---------
 public     | s2        | relname    | (7,29)
 public     | s3        | usename    | (0,11)
(2 rows)

Get a result row with the corresponding base table and and ctid


sql
select * from public.w where ctid='(0,2)';
 title |  body  |         tsv         
-------+--------+---------------------
 toto  | foobar | 'foobar':2 'toto':1

그 외 다양한 활용

정확한 제약조건 대신 grep 처럼 정규식을 활용한 검색을 할 수도 있습니다.

SELECT ctid FROM %I.%I WHERE cast(%I as text)=%L

이렇게 바뀔 수도 있습니다:

SELECT ctid FROM %I.%I WHERE cast(%I as text) ~ %L
민감하지 않은 비교를 위해서는 이렇게 쓸 수도 있습니다:

SELECT ctid FROM %I.%I WHERE lower(cast(%I as text)) = lower(%L)

활용 예


sql
select * from search_columns('23fb9d28-3976-4b87-9545-403c45f8b8c8');

특정 UUID 를 검색 한다면, 관련된 모든 데이터를 전체 테이블에서 찾아줍니다.

모든 테이블을 다 찾기 때문에 데이터베이스의 크기가 클때 검색 시간은 꽤 걸리지만 그래도 덤핑해서 검색하거나 한 테이블씩 모두 찾을 때에 비해서는 훨씬 효율적입니다.

테이블명, 컬럼명, rowctid가 모두 나오기 때문에 한눈에 쉽게 알아볼 수 있습니다. 이상입니다.

References

https://stackoverflow.com/questions/5350088/how-to-search-a-specific-value-in-all-tables-postgresql

저작자표시 비영리 변경금지 (새창열림)

'Data > PostgreSQL' 카테고리의 다른 글

할 때마다 까먹어서 정리하는 PSQL 접속 방법 (0)	2023.01.04
[POSTGRES] 전체 테이블, 컬럼 정보 조회 (0)	2022.07.26
Postgres) 계층형 쿼리작성 및 csv로 결과 저장하기 (0)	2021.12.02
Postgres) rownum 사용과 Subquery를 통한 update (0)	2021.11.19
MacOS PostgreSQL 설치 하고 테이블 생성, 조회하기 (0)	2021.08.04

현재글PostgreSQL) 모든 테이블에서 특정 값 찾기
관련글 [POSTGRES] 전체 테이블, 컬럼 정보 조회
관련글 Postgres) 계층형 쿼리작성 및 csv로 결과 저장하기
관련글 Postgres) rownum 사용과 Subquery를 통한 update
관련글 MacOS PostgreSQL 설치 하고 테이블 생성, 조회하기

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

PostgreSQL) 모든 테이블에서 특정 값 찾기

모든 테이블 찾기

1. 데이터베이스 전체 덤핑한 후 grep 하기

2. function 만들어 찾기

사용법

그 외 다양한 활용

활용 예

'Data > PostgreSQL' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역