Research Article

Journal of Agricultural, Life and Environmental Sciences. 30 June 2024. 152-163
https://doi.org/10.22698/jales.20240014

ABSTRACT


MAIN

  • 서 론

  • 재료 및 방법

  •   공간적 범위 및 연구 개요도

  •   APEX 모델을 이용한 최적관리기법 평가

  •   머신러닝 모델 학습 및 검증

  • 결과 및 고찰

  •   최적관리기법 시나리오별 양분 유출 부하량 저감 효과

  •   최적관리기법 시나리오별 머신러닝 모델의 양분 유출 부하량 예측

  • 요약

서 론

최근 가축분뇨와 화학비료의 사용 증가로 농경지에 과다 투입된 양분이 강우시 토양과 함께 하천으로 유출되는 문제가 빈번히 발생하고 있다. 이러한 양분 유출은 작물 생산성과 토양의 건강성을 저하시키고, 부영양화 및 녹조와 같은 잠재적인 수질오염 문제로 이어지고 있다(Lee et al., 2020a; Park and Cho, 2023). 또한, 기후변화에 따른 강우 패턴의 변화는 농경지에서의 양분 유출 문제를 가속화 할 것으로 전망되고 있다(NIAS, 2020). 이에 따라, 농업의 지속가능성을 확보하고 하류 수계의 수질 및 생태계를 보호하기 위한 양분 유출 관리방안이 절실히 요구되고 있다.

그동안 농경지에서의 양분 유출 발생 특성을 분석하기 위한 시험포 단위의 현장 모니터링 연구들은 다수 진행되어 왔다(Choi et al., 2012; Joo and Lee, 2011; Kim et al., 2013; Lee et al., 2017) 그러나 지속적인 모니터링에 필요한 인력, 비용, 시간 등 여러 제약이 따르면서 SWAT(Soil Water Assessment Tool)(Arnold et al., 1998), HSPF(Hydrologic Simulation Program-FORTRAN)(Bicknell et al., 1997), APEX(Agricultural Policy and Environmental eXtender)(Williams and Izaurralde, 2006) 등과 같은 다양한 수문 모델이 대체 수단으로 유용하게 활용되고 있다. 특히 APEX 모델은 필지 단위에서 유량 및 수질 모의를 비롯한 경운, 윤작, 시비, 관개, 농약 살포, 최적관리기법(Best Management Practices, BMPs) 등의 다양한 토지 관리 전략에 따른 농업환경 영향 평가가 가능하다(Gassman et al., 2010). 이에 국내・외에서는 APEX 모델을 활용한 다양한 양분 유출 모의 연구들이 진행되어 왔다. 사례를 살펴보면, Koo et al.(2017)은 APEX 모델의 국내 적용을 위한 데이터베이스(Database, DB)를 구축하고, 고랭지 밭을 대상으로 총 인(Total phosphorus, T-P) 부하량 모의 적용성을 평가하였으며, So et al.(2018)은 APEX 모델을 이용하여 지표 피복, 작물 생육 기간, 밭 토양 특성 등 다양한 시나리오 적용에 따른 총 질소(Total Nitrogen, T-N) 부하량 저감 효과를 분석하였다. 또한, Francesconi et al.(2014)은 인디애나 북동부 지역의 두 개의 옥수수-콩 윤작 밭을 대상으로 경운 방법이 토양유실량과 양분 유출 거동에 미치는 영향을 평가하였다.

이처럼, APEX 모델은 장기간의 양분 유출 모의 및 BMPs 효율 평가에 유용하게 사용되어 왔다. 그러나 경작지별로 다른 작물, 영농 형태, 지형 특성 등이 상이하기 때문에 양분 유출 모의의 정확성을 확보하기 위해서는 모델 매개변수의 상세한 보정과 방대한 입력자료가 필요하다. 더 나아가, 이러한 모델의 물리적 프로세스를 이해하는데 있어서는 전문 지식이 요구되기 때문에 활용성이 다소 제한될 수 있다. 이에 경작지 단위에서의 양분 유출 및 BMPs 효과를 효율적으로 평가할 수 있는 새로운 방안이 필요하다. 최근 수자원 분야에서 머신러닝(Machine Learning) 모델은 댐의 방류량 및 유입량(García-Feal et al., 2022; Hong et al., 2020; Lee et al., 2023), 하천의 유량 및 수질(Jun et al., 2020; Khosravi et al., 2022; Lee et al., 2020b), 그리고 생태계 건강성 등급(Lee et al., 2021; Valerio et al., 2021; Woo et al., 2019)의 예측에 효과적으로 사용되어 오고 있다. 머신러닝은 주어진 자료를 바탕으로 자동 학습과 패턴 인식을 통해 예측을 수행하는 기술이다. 머신러닝 모델의 학습 성능을 최대화하기 위해서는 적절한 모델 선택과 하이퍼파라미터(Hyperparameter) 조정뿐만 아니라, 충분한 양과 질의 자료 확보가 필수적이다. 장기간의 양분 유출 모니터링 자료 수집이 제한적인 상황에서, 물리적 프로세스 기반 모델로부터 생성된 데이터셋은 머신러닝 모델의 학습자료로서 유용하게 사용될 수 있다. 그럼에도 불구하고, 아직까지 APEX 모델과 머신러닝 모델을 이용하여 BMPs 시나리오별 양분 유출 부하량을 효율적으로 예측하는 연구는 진행되지 않았다.

따라서 본 연구의 목적은 전국의 수변구역 및 상수원 보호구역 내 밭을 대상으로, APEX 모델을 이용해 BMPs 시나리오별 양분 유출 DB를 구축하고, 이를 머신러닝 모델의 학습자료로 사용함으로써, 머신러닝 모델의 양분 유출 부하량 예측 가능성을 평가하는 것이다.

재료 및 방법

공간적 범위 및 연구 개요도

본 연구에서는 전국의 수변구역 및 상수원 보호구역 내 면적이 최소 1,000 m2 이상인 141,068개의 밭을 대상으로 양분 유출 부하량을 예측하였다. 양분 유출 모의를 위해 2020년 통계청의 전국 시도별 작물별 재배면적 자료를 참고하여 화훼와 사료작물을 제외한 비율이 높은 서류와 두류, 채소류, 특용작물 군을 분류하고, 각 작물 군 중 생산량이 높은 감자(서류), 콩(두류), 수박(채소류-과채류), 배추(채소류-엽채류), 무(채소류-근채류), 양파, 고추(채소류-조미채소), 참깨(특용작물)를 대표 작물로 선정하였다. 또한, 실제 밭에서 경작 중인 작물의 상황을 정확히 파악하기 어렵기 때문에 시도별 재배면적 비율에 따라 밭에 작물을 할당하였다. 본 연구의 공간적 범위와 개요도는 Fig. 1에서 확인할 수 있다. 개요도를 살펴보면, 첫 번째 단계에서는 141,068개의 밭을 대상으로 APEX 모델을 사용하여 양분 유출 부하량을 모의하고 BMPs 시나리오별 양분 유출 부하량 DB를 구축하였다. 두 번째 단계에서는 APEX 모델로 모의된 양분 유출 부하량을 머신러닝 모델의 예측 인자로 활용하여 교차검증을 수행하였다. 이후에 교차검증을 통해 선정된 최적의 머신러닝 모델을 사용하여 APEX 모델의 BMPs 시나리오별 양분 유출 항목을 동일하게 예측할 수 있는지 적용 가능성을 평가하였다.

https://cdn.apub.kr/journalsite/sites/ales/2024-036-02/N0250360209/images/ales_36_02_09_F1.jpg
Fig. 1.

Spatial extent and overview diagram of this study.

APEX 모델을 이용한 최적관리기법 평가

APEX 모델 개요 및 입력자료 구축

텍사스 A&M 대학 농업생명연구소(Texas A&M AgriLife Research)에 의해 개발된 APEX 모델은 필지 단위 및 소규모 유역에서의 지속 가능한 농업 생산성 향상을 목표로 경제성, 관개, 수질, 토질, 작물 경합, 날씨와 해충 등의 요소를 고려한 환경관리 전략 평가에 사용되고 있다(Williams et al., 1984). APEX 모델은 토양침식이 생산성에 미치는 영향을 평가하기 위해 개발된 EPIC(Environmental Policy Integrated Climate) 모델에서 유래되었는데, 날씨 모의 구동, 수문, 침식-퇴적, 작물 생장, 양분순환, 관개 일정 관리, 배수 등과 같은 EPIC 모델의 기능을 확장하여 유출량, 유사, 양분 및 농약의 거동을 추적하는 기능을 포함하고 있다. APEX 모델에서는 하나의 유역이 토양, 토지이용, 영농관리 및 기상의 동질성에 따라 최대 4,000개의 하위영역으로 구분될 수 있으며, 필지부터 소유역 단위에 이르기까지의 연속적인 간격으로 작물 생산량(ton/ha), 유출량(mm), 유사(ton/ha), 유사에 의한 질소 및 인의 손실(Nitrogen loss in sediment, YN; Phosphorus loss in sediment, YP) 및 수용성 질소 및 인의 손실(Nitrogen loss in surface runoff, QN; Phosphorus loss in surface runoff, QP)을 모의할 수 있다. 또한, APEX 모델은 계단식 경작지, 초생수로, 식생 완충대, 윤작, 비료, 관개, 제방, 배수 시스템 및 가축분뇨 관리 등과 같은 토지 관리 전략에 대한 효과를 효율적으로 평가할 수 있다. APEX 모델은 Fig. 2에 나타난 바와 같이 다양한 입력 파일(.DAT)을 통해 구동되는데, 일반적으로 사용자가 모의하고자 하는 경작지별 지형, 토양 속성, 영농일정, 기상 등과 같은 입력자료 구축이 필요하다. 본 연구에서는 Goo et al.(2017)의 APEX 모델 DB 구축 방법을 참고하여 경작지별 입력자료를 구축하였다.

https://cdn.apub.kr/journalsite/sites/ales/2024-036-02/N0250360209/images/ales_36_02_09_F2.jpg
Fig. 2.

Framework of the APEX model data structure (Steglich et al., 2023).

경작지별 경사도 특성은 국토교통부 국토지리정보원의 수치지형도를 이용하여 제작된 30 m 해상도의 수치표고모델(Digital Elevation Map, DEM)을 이용하여 추출하였다. 경작지별 경계 자료는 고해상도 위성과 항공 영상을 이용해 제작한 농림수산식품교육문화정보원의 스마트 팜 맵을 이용하여 구축하였다(Fig. 3). 경작지별 대표 토양 유형은 경작지 경계자료와 수치 정밀토양도(1:25,000) 자료를 중첩하여 선정하고, 각 대표 토양에 대한 입력자료는 농촌진흥청의 흙토람(https://soil.rda.go.kr/)에서 제공하는 토양통 속성자료를 기준으로 구축하였다. 작물별 파종, 수확 시기, 경운 등의 영농일정은 농촌진흥청의 농업기술포털 농사로(https://www.nongsaro.go.kr/)에서 제공하는 농・작업 일정 자료를 기준으로 구축하였다. 경작지별 기상 입력자료는 기상청의 기상자료개방포털(https://data.kma.go.kr/)에서 제공되는 30년 이상의 연속 자료를 포함하는 67개 기상관측소의 기상자료를 APEX 모델의 입력자료 형식(.DLY)으로 변환하여 사용하였다.

https://cdn.apub.kr/journalsite/sites/ales/2024-036-02/N0250360209/images/ales_36_02_09_F3.jpg
Fig. 3.

Cultivated land boundaries within riparian and drinking water protection areas.

APEX 모델 검증 및 최적관리기법 시나리오 구축

필지 단위로 APEX 모델을 보정하기 위해서는 경작지에서의 유출량 및 수질에 관한 모니터링 자료가 필요하다. 그러나, 경작지마다 토성, 경사도, 작물 종류 등의 특성도 다르며, 장기간의 모니터링 자료 수집이 제한되기에 모든 경작지에 대한 보정은 현실적으로 어려움이 있다. 본 연구에서는 양분 유출 모니터링 자료 수집의 제한으로 춘천 서면 시험포에서 수집한 특정 작물인 감자 바이오매스 모니터링 자료(ME, 2019)만을 사용하여 APEX 모델을 검증하였다. APEX 모델 검증은 춘천시 내 수변구역 및 상수원 보호구역에 속하는 1,353개의 경작지를 대상으로 APEX 모델로 모의된 연평균 감자 바이오매스와 시험포 모니터링을 통해 측정된 바이오매스를 비교 분석하여 이루어졌다. 밭 토양의 속성은 서면 시험포와 동일한 양토로 적용하였으며, 기상자료는 춘천기상대의 2021년 10월까지의 일 단위 기상자료를 입력자료로 사용하였다. 감자 바이오매스 검증 이후에 APEX 모델을 사용하여 전국 지역의 수변구역 및 상수원 보호구역 내 141,068개의 밭작물(무, 감자, 고추, 배추, 수박, 양파, 참깨, 콩)에 대한 양분 유출(YN, QN, YP, QP) 부하량의 변화를 모의하였다. 모의 기간은 모델의 초기 반응 계수 안정화 기간(5년)을 포함하여 2002년부터 2021년까지 총 19년으로 설정하였다. 또한, APEX 모델 내 총 3개의 BMPs 시나리오(시나리오 1: 비료 사용량 50% 저감, 시나리오 2: 초생대 적용, 시나리오 3: 무경운 농법 적용) 적용에 따른 양분 유출 부하량의 저감 효과를 분석하고, 머신러닝 모델의 학습자료로 활용하기 위한 시나리오별 양분 유출 부하량 DB를 구축하였다.

머신러닝 모델 학습 및 검증

본 연구에서는 APEX 모델을 활용하여 모의 된 양분 유출 부하량과 BMPs 시나리오별 양분 유출 부하량 DB를 학습하기 위해 6개의 머신러닝 모델을 사용하였다(Table 1). 머신러닝 모델들의 학습에는 파이썬 언어를 기반으로 하며, 다양한 머신러닝 라이브러리와 패키지를 지원하는 scikit-learn(Version 0.24.2), xgboost(Version 1.4.2), lightgbm(Version 3.3.2) 패키지가 사용되었다. 학습 데이터셋은 2007년부터 2021년까지의 작물명, 경사도(m/m), 경사 크기(m), 면적(ha), 고도(m), 토양 유형, 월별 최저 및 최대기온(°C), 월별 총강수량(mm), 월별 총일사량(MJ/m2) 총 54개 입력변수와 APEX 모델로 모의 된 YN(kg/ha), QN(kg/ha), YP(kg/ha), QP(kg/ha) 총 4개의 목적변수로 구성되었다. 머신러닝 모델의 학습 성능은 3차 교차검증을 통해 평가되었으며, 교차검증 평균 성능이 우수한 머신러닝 모델은 2007년부터 2016년까지의 자료를 학습하여 2017년부터 2021년까지의 양분 유출 부하량을 예측하는 데 사용되었다. 머신러닝 모델의 예측 성능은 양분 유출 부하량 예측 결과와 APEX 모델의 모의값의 비교 분석을 통해 평가되었으며, 이 때, YN과 QN의 합인 T-N과 YP와 QP의 합인 T-P를 평가항목으로 하였다. 평가지표로는 머신러닝 회귀 모델의 성능 평가에 일반적으로 사용되는 R2, NSE(Nash and Sutcliffe, 1970), RMSE(Root Mean Squared Errors), MAE(Mean Absolute Error)가 사용되었다.

Table 1.

Machine learning models used in this study and their hyperparameters

Models Hyperparameters Notation
Decision Tree
(Song and Ying, 2015)
max_depth = 25, max_features = 8,
min_samples_split = 2, min_samples_leaf = 1
DT
Random Forest
(Breiman, 2001)
n_estimators = 100, max_depth = 25, max_features = 8,
min_samples_split = 2, min_samples_leaf = 1
RF
Gradient Boosting Model
(Natekin and Knoll, 2013)
n_estimators = 100, max_depth = 25,
max_features = 8,learning_rate = 0.1
GB
eXtreme Gradient Boosting
(Chen and Guestrin, 2016)
n_estimators = 100, max_depth = 25,
objective = “reg:linear”, learning_rate = 0.3,
min_child_weigh = 1
XGB
Extra Trees
(Geurts et al., 2006)
n_estimators = 100, max_depth = 25,
max_features = 8, min_samples_split = 2,
min_samples_leaf = 1
ET
Light Gradient Boosting Machine
(Ke et al., 2017)
n_estimators = 100, learning_rate = 0.1,
num_leaves = 31
LGBM

결과 및 고찰

최적관리기법 시나리오별 양분 유출 부하량 저감 효과

APEX 모델에 의한 감자 바이오매스 생산량의 평균은 15.6 ton/ha로 산정되었으며, 이는 서면 시험포에서 관측된 감자의 바이오매스 생산량인 15.1 ton/ha와 비교했을 때, 약 5% 이내의 오차 범위에 해당하는 것으로 분석되었다. Fig. 4는 검증된 APEX 모델로 BMPs 시나리오 적용에 따른 작물별 연평균 양분 유출 부하량을 모의한 결과를 나타낸다. YN은 배추에서 1109.2 kg/ha로 발생량이 가장 높았으며, 시나리오 1(비료 사용량 50% 저감)에서 629.9 kg/ha, 시나리오 2(초생대 적용)에서 634.2 kg/ha, 시나리오 3(무경운 농법 적용)에서 980.0 kg/ha로 시나리오별 43.2%, 42.8%, 11.7%가 저감 된 것으로 나타났다(Fig. 4a). QN도 배추에서 47.3 kg/ha로 가장 높았으며, 시나리오 1에서 23.8 kg/ha, 시나리오 2에서 11.8 kg/ha, 시나리오3에서 39.2 kg/ha로 시나리오별 49.7%, 75.1%, 17.0%가 저감 된 것으로 분석되었다(Fig. 4b). YP는 양파에서 191.3 kg/ha로 가장 높았으며, 시나리오 1에서 115.3 kg/ha, 시나리오 2에서 79.2 kg/ha, 시나리오 3에서 102.6 kg/ha로 시나리오별 39.7%, 58.6%, 46.4%가 저감 된 것으로 나타났다(Fig. 4c). QP는 배추에서 150.8 kg/ha로 발생량이 가장 높았으며, 시나리오 1에서 67.5 kg/ha, 시나리오 2에서 50.6 kg/ha, 시나리오 3에서 83.3 kg/ha로 시나리오별 55.2%, 66.4%, 44.8% 저감 된 것으로 나타났다(Fig. 4d). 각 시나리오별 모든 작물에 대한 평균 양분 유출 저감 효율은 시나리오 1에서 41.3%, 시나리오 2에서 61.6%, 시나리오 3에서 14.9%로, 초생대 조성이 비료 사용량 저감 대책과 무경운 농법에 비해 양분 유출 부하량 저감에 효과적인 것으로 나타났다(Table 2). 이는 이전 연구들(Jeong et al., 2022; Lee et al., 2018) 에서 나타난 바와 같이 초생대에 의한 유출율 저감과 비점오염물질의 여과, 흡착, 침전 작용의 영향으로 판단된다. 하지만 모든 경작지에 초생대를 조성하는 것은 현실적인 제약이 따르며, 작물의 종류와 피복율, 초생대의 규모, 경사도, 경사장, 토양 등 다양한 인자에 따라 양분 유출 저감 효과는 크게 달라질 수 있기 때문에, 경작지의 특성을 고려한 양분 유출 관리방안이 필요할 것으로 판단된다.

https://cdn.apub.kr/journalsite/sites/ales/2024-036-02/N0250360209/images/ales_36_02_09_F4.jpg
Fig. 4.

Nutrient runoff by crop type under BMPs scenarios.

Table 2.

Efficiency of nutrient runoff reduction by BMPs scenarios

Category Scenario 1 (%) Scenario 2 (%) Scenario 3 (%)
YN 35.1 46.2 8.2
QN 42.7 70.3 12.2
YP 37.6 60.8 19.5
QP 49.9 69.1 19.8
Ave. 41.3 61.6 14.9

최적관리기법 시나리오별 머신러닝 모델의 양분 유출 부하량 예측

Fig. 5는 3차 교차검증을 통해 산정된 머신러닝 모델별 교차검증 평균 성능을 보여준다. YN은 DT 모델을 제외한 모든 모델에서 R2 및 NSE가 0.8 이상으로 측정되었다. QN의 경우, RF, XGB, LGBM 모델들에서 R2 및 NSE가 0.6 이상으로 분석되었다. YP 및 QP에서는 DT 모델을 제외하고 모든 모델의 R2과 NSE가 각각 0.6, 0.8 이상으로 나타났다. 모든 양분 유출 항목에서 DT 모델의 성능이 낮게 나타났는데, 이는 DT 모델이 특정 자료에 과적합 된 결과로 보인다. 반면, XGB 모델은 모든 양분 유출 항목에서 가장 우수한 성능을 가지는 것으로 나타났다. 이는 XGB의 부스팅 기법, 결측값 자동 처리, 병렬처리, 정규화 기능 등의 영향으로 모델의 일반화 능력이 향상되었기 때문이라 생각된다. 전반적으로, YN과 QP에 비해 QN과 YP에 대한 교차검증 평균 성능은 머신러닝 모델별로 큰 차이를 보였다. 이는 교차검증 방식과 하이퍼파라미터 설정의 영향뿐만 아니라, 머신러닝 모델이 각 양분 유출의 발생 특성을 충분히 반영하지 못한 학습 인자의 한계 때문일 수 있다. YN과 YP는 토양의 물리적 침식의 큰 영향을 받는 반면, QN과 QP는 표면 유출수와 함께 이동하는 특성을 지니고 있어, 물의 흐름이나 이동 경로와 관련된 인자가 중요할 수 있다. 이처럼 각 양분 유출 항목은 서로 다른 환경적 및 물리적 요인에 의해 영향을 받기 때문에 각 양분 유출 유형에 적합한 머신러닝 모델의 학습 인자를 추가적으로 검토하고, 이를 반영한 머신러닝 모델별 하이퍼파라미터 최적화가 필요할 것으로 판단된다.

https://cdn.apub.kr/journalsite/sites/ales/2024-036-02/N0250360209/images/ales_36_02_09_F5.jpg
Fig. 5.

Average cross-validation performance of machine learning models for nutrient runoff loads prediction.

Fig. 6은 교차검증을 통해 선정된 XGB 모델을 통해 예측된 2017년부터 2021년까지의 연평균 양분 유출 부하량을 APEX 모의값과 비교 분석한 결과를 나타낸다. 시나리오별 살펴보면, 비료 사용량을 50% 줄인 시나리오 1(Fig. 6a)에서는 T-N의 경우 R2과 NSE가 각각 0.73과 0.47로, RMSE와 MAE는 각각 133.7 kg/ha, 86.6 kg/ha로 분석되었다. T-P의 경우 R2과 NSE는 0.55와 0.48로, RMSE와 MAE는 각각 37.5 kg/ha, 29.9 kg/ha로 분석되었다. 초생대를 적용한 시나리오 2(Fig. 6b)에서는 T-N의 경우 R2과 NSE가 각각 0.68과 0.62로, RMSE와 MAE는 121.3 kg/ha, 84.7 kg/ha로 분석되었다. T-P의 경우 R2과 NSE가 0.51과 0.42로, RMSE와 MAE는 37.5 kg/ha, 29.7 kg/ha로 분석되었다. 무경운 농법을 적용한 시나리오 3(Fig. 6c)에서는 T-N의 경우 R2과 NSE가 각각 0.85와 0.84로, RMSE와 MAE는 107.8 kg/ha, 78.5 kg/ha로 분석되었다. T-P의 경우 R2과 NSE가 0.59와 0.53으로, RMSE와 MAE는 51.9 kg/ha, 38.8 kg/ha로 분석되었다. 전반적으로 XGB 모델은 T-P보다 T-N에 대한 예측 성능이 더 우수하였으며, XGB 모델은 평균적으로 T-N에 대해 R2 0.75, NSE 0.65, T-P에 대해 R2 0.55, NSE 0.48로 양호한 성능을 보여주었다. 본 결과를 통해 머신러닝 모델만으로도 APEX 모델의 양분 유출 부하량을 충분히 재현할 수 있는 가능성을 확인하였다.

https://cdn.apub.kr/journalsite/sites/ales/2024-036-02/N0250360209/images/ales_36_02_09_F6.jpg
Fig. 6.

Scatter plot of nutrient runoff predictions using the XGB model under BMPs scenarios compared with simulated values from the APEX model. The s-dashed line represents the best fit line for the data points.

요약

본 연구에서는 전국의 수변구역과 상수원 보호구역 내 밭을 대상으로 APEX 모델을 통해 다양한 BMPs 시나리오(비료 사용량 50% 저감, 초생대 적용, 무경운 농법)에 대한 양분 유출 부하량 DB를 구축하고, 이를 머신러닝 모델의 학습자료로 사용함으로써, 머신러닝 모델의 양분 유출 예측 가능성을 평가하였다. 연구 결과, APEX 모델 내 초생대 적용이 비료 사용량 저감 및 무경운 농법에 비해 더 높은 저감 효과를 보였고, 6개의 트리 기반 머신러닝 모델 중 XGB 모델이 모든 양분 유출 항목(YN, QN, YP, QP)에서 가장 우수한 교차검증 성능을 나타냈다. 또한, APEX 모델로 구축된 BMPs 시나리오 DB를 학습한 XGB 모델은 T-N과 T-P에 대해 각각 R2 0.75, NSE 0.65 및 R2 0.55, NSE 0.48의 예측 성능을 보여 지형 및 기상자료만으로도 BMPs 적용에 따른 양분 유출 부하량을 효과적으로 예측할 수 있는 것을 확인하였다. 이는 물리적 프로세스 기반의 모델을 통해 생성된 합성 데이터가 머신러닝 모델의 학습 데이터로 효과적으로 활용될 수 있음을 보여준다. 그러나 개별 밭작물에 대한 유출량 및 수질이 검증되지 않았기 때문에 APEX 모델로 모의된 양분 유출 부하량에는 불확실성이 존재할 수 있다. 따라서 머신러닝 모델을 APEX 모델의 대체 수단으로 활용하기 전에, APEX 모델의 양분 유출 예측 정확성을 높이기 위한 추가적인 검증이 필요할 것으로 생각된다. 이를 위해서는 양분 유출의 발생 원단위와 관련된 충분한 양의 유출량 및 수질 관측자료의 확보가 중요할 것이다. 또한, 각 양분 유출 항목별 적합한 학습 인자를 선정하여 중요도 분석을 수행하고, 이를 반영한 머신러닝 모델의 성능 검증과 하이퍼파라미터 최적화 연구가 필요할 것으로 보인다.

기후변화와 더불어 가축분뇨와 화학비료 사용이 증가함에 따라 양분 유출 관리의 필요성이 증대되는 시점에서, 본 연구의 결과는 양분 유출 부하량 및 다양한 BMPs 적용 효과를 평가하기 위한 방법론으로 활용될 수 있을 뿐만 아니라, 지속 가능한 농업을 촉진하고 하류 수계의 수질 및 생태계를 보호하는 데 기여할 수 있는 방안을 제시할 것으로 기대된다.

Acknowledgements

본 연구는 환경부 표토보전관리기술개발사업(2019002820003)과 수생태계 건강성 확보 기술개발사업(2020003030004)의 지원에 의해 수행되었음을 밝힙니다.

References

1

Arnold, J. G., Srinivasan, R., Muttiah, R. S., Williams, J. R. (1998) Large area hydrologic modeling and assessment part I: model development 1. J Am Water Resour Assoc 34:73-89.

10.1111/j.1752-1688.1998.tb05961.x
2

Bicknell, B. R., Imhoff, J. C., Kittle Jr, J. L., Donigian Jr, A. S., Johanson, R. C. (1997) Hydrological simulation program-FORTRAN user's manual for version 11. Environmental Protection Agency Report No. EPA/600/R-97/080. US Environmental Protection Agency, Athens, Ga.

3

Breiman, L. (2001). Random forests. Machine learning 45:5-32.

10.1023/A:1010933404324
4

Chen, T., Guestrin, C. (2016) Xgboost: A scalable tree boosting system. In: Proceedings of the 22nd Acm Sigkdd International Conference on Knowledge Discovery and Data Mining 785-794.

10.1145/2939672.2939785
5

Choi, J. K., Son, J. K., Lee, H. J., Kim, Y. (2012) Runoff Characteristics of Total-N and Total-P in Upland Surface Runoff Treated with Livestock Manure Compost. J Korean Soc Agric Eng 54:29-37. http://dx.doi.org/10.5389/KSAE.2012.54.6.029

10.5389/KSAE.2012.54.6.029
6

Francesconi, W., Smith, D. R., Heathman, G. C., Wang, X., Williams, C. O. (2014) Monitoring and APEX modeling of no-till and reduced-till in tile-drained agricultural landscapes for water quality. Trans of the ASABE 57:777-789.

10.13031/trans.57.10332
7

García-Feal, O., González-Cao, J., Fernández-Nóvoa, D., Astray Dopazo, G., Gómez-Gesteira, M. (2022) Comparison of machine learning techniques for reservoir outflow forecasting. Nat Hazards Earth Syst Sci Discuss 22:1-27. https://doi.org/10.5194/nhess-22-3859-2022

10.5194/nhess-22-3859-2022
8

Gassman, P. W., Williams, J. R., Wang, X., Saleh, A., Osei, E., Hauck, L., Izaurralde, R. C., Flowers, J. (2010) The Agricultural Policy/Environmental eXtender (APEX) model: An emerging tool for landscape and watershed environmental analyses. Trans of the ASABE 53:711-740.

10.13031/2013.30078
9

Geurts, P., Ernst, D., Wehenkel, L. (2006) Extremely randomized trees. Machine learning 63:3-42.

10.1007/s10994-006-6226-1
10

Hong, J., Lee, S., Bae, J. H., Lee, J., Park, W. J., Lee, D., Kim, J., Lim, K. J. (2020) Development and evaluation of the combined machine learning models for the prediction of dam inflow. Water 12:2927. https://doi.org/10.3390/w12102927

10.3390/w12102927
11

Jeong, Y., Lee, D., Kang, H., Jang, W. S., Hong, J., Lim, K. J. (2022) Efficiency Evaluation of Vegetative Filter Strip for Non-point Source Pollutant at Dense Upland Areas - Focused on Non-point Source Management Area Mandae, Gaa, and Jaun Basins -. J Korean Soc Agric Eng 64:1-10. https://doi.org/10.5389/KSAE.2022.64.4.001

12

Joo, J. H., Lee, S. B. (2011) Assessment of Nutrient Losses in Different Slope Highland Soils Amended with Livestock Manure Compost. Korean Soc Soil Sci Fert 44:361-367. https://doi.org/10.7745/KJSSF.2011.44.3.361

10.7745/KJSSF.2011.44.3.361
13

Jun, K., Kwon, D., KI, S. J., (2020) Comparing the Performance of Machine Learning Algorithms in Predicting River Water Quality and Quantity. KSWST Jour Wat Treat 28:49-57. https://doi.org/10.17640/KSWST.2020.28.1.49

10.17640/KSWST.2020.28.1.49
14

Ke, G., Meng Q., Finley, T., Wang, T., Chen, W., Ma, W., Ye, Q., Liu, T. Y. (2017) LightGBM: a highly efficient gradient boosting decision tree. In Proceedings of the 31st International Conference on Neural Information Processing Systems (NIPS'17). Curran Associates Inc., Red Hook, NY, USA, 3149-3157.

15

Khosravi, K., Golkarian, A., Tiefenbacher, J. P. (2022) Using optimized deep learning to predict daily streamflow: A comparison to common machine learning algorithms. Water Resour Manag 36:699-716. https://doi.org/10.1007/s11269-021-03051-7

10.1007/s11269-021-03051-7
16

Kim, M. K., Kwon, S. I., Jung, G. B., Hong, S. C., Chae, M. J., Yun, S. G., So, K. H. (2013) Small-Scale Pond Effects on Reducing Pollutants Load from a Paddy Field. Korean J Environ Agric 32:355-358. http://dx.doi.org/10.5338/KJEA.2013.32.4.355

10.5338/KJEA.2013.32.4.355
17

Koo, J. Y., Kim, J., Choi, S. K., Kim, M. K., Jeong, J., Lim, K. J. (2017) Construction of Database for Application of APEX Model in Korea and Evaluation of Applicability to Highland Field. J Korean Soc Agric. Eng 59:89-100. https://doi.org/10.5389/KSAE.2017.59.6.089

18

Lee, J. H., Choi, B. R., Cho, G. G., Jang, E. K., Kim, Y. R., Ji, J. H., Na, H. S., Lee, S. E., Ku, H. H. (2020a) Effect of controlled-release coated fertilizer on yield and nitrogen use efficiency in a red pepper cultivated field. Korean J Soil Sci Fert 53:519-527. https://doi.org/10.7745/KJSSF.2020.53.4.519

10.7745/KJSSF.2020.53.4.519
19

Lee, S. G., Jang, J. R., Choi, K. S. (2018) Simulation of sediment reduction effects of VFS in uplands of Saemangeum watershed. J Korea Water Resour Assoc 51:535-542. doi:10.3741/JKWRA.2018.51.6.535

20

Lee, S. I., Shin, J. Y., Shin, M. H., Ju, S. H., Seo, J. Y., Park, W. J., Choi, J. D. (2017) Characteristics of non-point pollutant runoff in highland field fields through long-term monitoring. J Korean Soc Agric Eng 59:85-96. https://doi.org/10.5389/KSAE.2017.59.4.085

21

Lee, S., Kim, J., Bae, J. H., Lee, G., Yang, D., Hong, J., Lim, K. J. (2023) Development of Multi-Inflow Prediction Ensemble Model Based on Auto-Sklearn Using Combined Approach: Case Study of Soyang River Dam. Hydrology 10:90. https://doi.org/10.3390/hydrology10040090

10.3390/hydrology10040090
22

Lee, S., Kim, J., Lee, G., Hong, J., Bae, J. H., Lim, K. J. (2021) Prediction of aquatic ecosystem health indices through machine learning models using the WGAN-based data augmentation method. Sustain 13:10435. https://doi.org/10.3390/su131810435

10.3390/su131810435
23

Lee, S.-M., Park, K.-D., Kim, I.-K. (2020b) Comparison of machine learning algorithms for Chl-a prediction in the middle of Nakdong River (focusing on water quality and quantity factors). J Korean Soc Water Wastewater 34:277-288. https://doi.org/10.11001/jksww.2020.34.4.277

10.11001/jksww.2020.34.4.277
24

Ministry of Environment (ME) (2019) Development of prediction technology of surface soil environmental change based on Big data, Sejong, Korea.

25

Nash, J. E., Sutcliffe, J. V. (1970) River flow forecasting through c onceptual models part I-A discussion of principles. J Hydrol 10:282-290. https://doi.org/10.1016/0022-1694(70)90255-6

10.1016/0022-1694(70)90255-6
26

Natekin, A., Knoll, A. (2013) Gradient boosting machines, a tutorial. Front Neurorobot 7:21. https://doi.org/10.3389/fnbot.2013.00021

10.3389/fnbot.2013.0002124409142PMC3885826
27

National Institute of Agricultural Sciences (NIAS) (2020) Study on Status of Nutrient Discharge from Agricultural Areas and Its Environmental Impacts due to Climate Change. Natl Inst Agric Sci Wanju, Korea.

28

Park, P. N., Cho, Y. C. (2023). Evaluation of Removal Efficiency of Pollutants in Constructed Wetlands for Controlling Nonpoint Sources in the Daechung Reservoir Watershed. Korean Soc Limnol 56:127-139. https://doi.org/10.11614/KSL.2023.56.2.127

10.11614/KSL.2023.56.2.127
29

So, H., Jang, T., Kim, D. H., Seol, D. M., Yoon, K. (2018) Surface Cover Effect for Reducing Nitrogen Load in Organic Farming Fields using APEX Model. J Korean Soc Agric Eng 60:55-67. https://doi.org/10.5389/KSAE.2018.60.5.55

30

Song, Y. Y., Ying, L. U. (2015) Decision tree methods: applications for classification and prediction. Shanghai Arch Psychiatry 27:130-135. https://doi.org/10.11919/j.issn.1002-0829.215044

31

Steglich, E. M., Osorio, J., Doro, J., Jeong, J., Williams, J. R. (2023) Agricultural Policy/Environmental eXtender Model User's Manual. AgriLIFE research, Temple, Texas.

32

Valerio, C., De Stefano, L., Martínez-Muñoz, G., Garrido, A. (2021) A machine learning model to assess the ecosystem response to water policy measures in the Tagus River Basin (Spain). Sci Total Environ 750:141252. https://doi.org/10.1016/j.scitotenv.2020.141252

10.1016/j.scitotenv.2020.14125233182174
33

Williams, J. R., Izaurralde, R. C. (2006) The APEX model. In Watershed models. Singh, V.P. and D.K. Frevert, eds. Boca Raton, FL: CRC Press, Taylor & Francis, 437-482.

10.1201/9781420037432.ch18
34

Williams, J. R., Jones, C. A., Dyke, P. T. (1984) A modeling approach to determining the relationship between erosion and soil productivity. Trans. of the ASAE 27:129-144.

10.13031/2013.32748
35

Woo, S. Y., Jung, C. G., Lee, J. W., Kim, S. J. (2019) Evaluation of watershed scale aquatic ecosystem health by SWAT modeling and random forest technique. Sustain 11:3397. https://doi.org/10.3390/su11123397

10.3390/su11123397
페이지 상단으로 이동하기