Releases: CampusPing/Assembly-Crawler
Releases · CampusPing/Assembly-Crawler
1.0.0-rc9
1.0.0-rc8
1.0.0-rc10
변경사항
집회 ID 생성 기준 변경
- 기존 ID 생성 방식에서 집회 시작, 종료 시간 추가
(날짜, 장소가 같지만 집회 시간이 다른 경우 고려)
1.0.0-rc7
1.0.0-rc6
변경사항
일일 집회 목록 (OneDayAssembly) data class로 개선
data class OneDayAssembly(
...
)크롤링 방식 개선
문제점
- 서울시 집회 사이트의 한 페이지당 10개의 집회 정보를 출력함
- Assembly-Crawler 라이브러리에서도 page 단위로 입력받아 집회 정보를 크롤링 하여 반환
- 이로 인해, 클라이언트 입장에서 불필요한 집회 정보까지 반환하며, 특정 날짜 단위로 조회가 불가능
개선방안
- pageSize 대신에 크롤링 하고자 하는 년도와 월을 입력 받는 구조로 개선
// 이전) 최신 집회 정보 크롤링 분량을 pageSize 단위로 입력받아 기능 수행 (1page = 10개 집회 정보)
fun crawl(pageSize: Int)
// 현재) 크롤링 하고자 하는 년도와 월을 입력받아 필요한 정보를 입출력 하는 구조로 개선
fun crawl(targetYear: Int, targetMonth: Int)1.0.0-rc5
1.0.0-rc4
개선 내용
- 집회 PDF에 시간이 중복으로 주어지는 경우 Assembly 객체에 값이 하나씩 밀려서 초기화되는 문제 개선
문제가 되는 예시 데이터
- 시간이 중복으로 제공되는 경우
오 늘 의 주 요 집 회
(04. 14. 18:00 기준 작성) 2025. 04. 15.(화)
집회 일시 집회 장소(행진로) 신고 인원 관할서 비고
14:00~15:30
14:00~15:30
여의도 국민은행 서관 앞
<여의도>
500명 영등포
15:00~17:30 반포124주구 공사현장 ⇄ 고속터미널R
<반포동> 1,000명 방 배
20:00~21:30 합정역 3出 → 홍대입구역 4出 1,500명 마 포
1.0.0-rc3
Full Changelog: 1.0.0-rc3...1.0.0-rc3
1.0.0-rc2
집회 정보 크롤링 기능 구현
서울시 집회 정보 크롤링 기능 구현
AssemblyCrawler.crawl(pageSize: Int) 메서드를 통해 List<OneDayAssembly> 를 반환받을 수 있습니다.
OneDayAssembly는 집회 날짜와 날짜에 해당하는 집회 리스트를 가지고 있습니다.