ID3算法赋能养老设施规划选址应用研究——以崇州市、大邑县和邛崃市为例
2026-03-27
文章首先以崇州市、大邑县和邛崃市全域为研究对象,基于第七次全国人口普查数据、现状养老设施数据、规划医疗设施数据及高德API数据,运用爬虫技术、ID3算法及决策树模型,对养老设施规划选址进行初步定量模拟;然后考虑床位缺口压力、规划医疗设施服务能力、服务设施便利度,利用GIS栅格叠加分析,将初步模拟结果进行优化;最后结合三地的国土空间总体规划、控制性详细规划及街镇政府的意向,提出算法赋能下的医养结合养老设施规划选址策略。 “ 作 者 施竹芳 重庆市住房和城乡建设委员会城市管线综合管理事务中心科员 赵万民 重庆大学教授、博士生导师,重庆城市科技学院建筑与土木工程学院院长 李 娜 崇州市规划和自然资源局高级工程师 罗 驿 重庆市住房和城乡建设委员会高级工程师 胡学礼 四川银行股份有限公司职员 朱 涛 中国城市规划设计研究院西部分院高级工程师
01 研究背景
根据国际上对老龄化社会的划分标准,一个地区60岁以上人口占总人口的比例达10%,65岁以上人口占总人口的比例达7%,该地区即进入老龄化。根据2021年国家统计局发布的《第七次全国人口普查公报》,我国60岁及以上人口占总人口的比例约为18.7%,65岁及以上人口占总人口的比例约为13.5%,分别比第六次全国人口普查时上升5.44%和4.63%。这表明我国已经进入老龄化社会,且老龄化程度正逐步加深。基于此,国家层面明确提出落实养老服务设施分区、分级规划建设,深化医养结合,拓展智慧养老服务。
1.1 研究对象及问题
崇州市、大邑县、邛崃市60岁及以上人口占比分别高达22.51%、24.05%、24.92%,高出全国老龄化平均水平3.81%、5.35%和6.22%。65岁及以上人口占比约为17.88%、19.39%、19.73%,分别比全国老龄化平均水平高4.38%、5.89%、6.23%,足见三地的老龄化程度更甚。加之三地自然资源本底优势显著,外来养老人员数量逐年增长,这便对三地的养老服务供给能力提出了更大考验。成都市政府按照规划床位千人测算指标及在规划人口的基础上提升20%的配套公共服务设施要求,规划至2035年,崇州市养老床位数为13467张,大邑县为10004张,邛崃市为11906张。基于三地现状养老床位数,可知养老床位缺口占规划总量的比例分别为55.51%、70.87%、72.22%,床位缺口压力颇大,对三地养老机构设施专项规划提出了更高要求。如何贯彻医养结合理念,并基于就地就近原则平衡床位缺口,有效分析养老机构设施的选址,成为三地养老专项规划的必修课题。
1.2 选址研究综述
在养老设施的可达性研究方面,韩非、徐子轩等通过改进后的“两步移动搜索法”进行选址优化探索;张乐艺采用标准差椭圆、地理集中指数、最邻近指数、洛伦兹曲线、基尼系数、区位熵、泰尔指数等方法,分析养老机构的空间集散程度及公平性;李珂采用最优供需分配法、基尼系数与洛伦兹曲线、LISA分析法、改进后的有容量约束的最大覆盖模型进行养老设施布局优化;王珍运用空间自相关、局部自相关、P-重心模型、可达性方差最小化模型,实现新建养老设施服务能力的优化。
在新技术及算法赋能的定量选址探索上,李雪、李斌、蔡志鹏等借助GIS和选址配置模型(LA 模型)进行选址;卜德清、马源鸿、李舸等通过AHP和GIS进行选址;颜文琪运用变异系数法、布谷鸟算法进行选址;刘新等以随机森林算法融合兴趣点(Point of Interest, POI)进行选址;李雪等构建双目标选址模型并借助CPLEX软件,运用ε-约束法进行选址;万婷等使用多目标规划算法及复合约束条件进行选址;方力、汪晓春、杨雪怡、马俊等基于决策树模型与机器学习定量模拟进行选址;张方方基于社区老年生活圈,提出“体、医、养”公共服务设施配置与优化策略。
总体而言,已有研究在设施可达性测算上取得了较多成果。随着新技术的革新及学科之间的融合发展,学者利用新技术及算法赋能设施定量选址的趋势愈加明显,这也为笔者提供了新的研究角度。但在机器算法运行的选址模型中,针对城乡全域数据采用统一模型运算略显不当,依笔者现场调研初步分析,城乡养老设施选址存在明显差别,不宜一以概之。与此同时,现有研究在定量模拟选址后,缺乏对床位缺口压力、规划医疗设施服务能力、服务设施便利度的有效量化分析。此外,现有文献的研究对象较为单一,缺乏既定地域上的多地区综合视野及研究方法的相互验证。
1.3 研究方法和目的
研究利用高德API与爬虫技术获取相关POI数据,结合笔者参与编制的崇州市、大邑县、邛崃市三地养老专项规划的前期现场踏勘,以及三地民政局、卫生健康委提供的资料,采用ID3算法及决策树模型,对养老设施规划选址进行初步定量模拟。考虑到街镇床位缺口压力、规划医疗设施服务能力、服务设施便利度,本研究利用GIS栅格叠加分析,将初步模拟结果进行优化,并结合传统手法,丰富成都地区养老设施选址规划方法。
02 基于算法赋能设施选址的逻辑构建
2.1 现状养老设施分布规律探寻
研究归集梳理与养老设施选址相关的POI数据、人口数据和医养设施数据,通过反复迭代构建基于ID3算法的最优决策树模型。
2.1.1 数据来源及处理
(1)POI数据及分类
2024年2月,研究借助高德地图API对三地的养老设施相关数据进行网络爬虫抓取,筛选清洗后得到有效数据89253条。其中,崇州市33265条,大邑县34495条,邛崃市21493条(表1)。以500m×500m为研究单元,将三地划分为15473个网格,其中,崇州市4645个,大邑县5489个,邛崃市5858个。由于三地接壤,会出现部分网格同时位于两地的情况(图1)。鉴于乡村养老设施选址具有较强的稳定性,研究对城镇开发边界内的养老设施选址作进一步探讨。

表1 养老设施相关POI数据分类统计
Tab.1 Classified statistics of POI data related to elderly care facilities
资料来源:笔者根据高德POI数据统计绘制

图1 高德POI设施分布图
Fig.1 Distribution map of Gaode POI facilities
资料来源:笔者根据高德POI数据和三地民政局提供的相关资料绘制
(2)人口数据
研究分析显示,三地老龄化率超过25%的街镇占总量的72.5%,其中邛崃市共计街镇数11个,占比高达78.57%。在老年人口数量上,三地超过1万人的街镇占总量的52.5%,其中崇州市共计街镇数9个,占比高达60%(图2)。

图2 三地老龄化率及老年人口分布图
Fig.2 Distribution map of aging rate and elderly population in the three areas
资料来源:笔者根据三地民政局提供的相关资料绘制
(3)医养设施数据
研究分析显示,在医疗设施方面,三地有医院40处,基层医疗卫生机构81处,共计121处。在养老设施方面,三地街镇级养老设施共计83处,其中邛崃市数量最多,共32处。三地社区级养老设施共计200处,其中崇州市高达80处(图3)。从总体上看,现状养老设施与成都市发布的指标要求差距较大,且在分布态势上与老年人口的分布匹配度不足,如崇州市崇阳街道现状床位数1162张,规划需求为4812张,缺口高达3650张。

图3 三地现状养老设施分布图
Fig.3 Distribution map of existing elderly care facilities in the three areas
资料来源:笔者根据三地民政局的提供相关资料绘制
本研究暂时不考虑村级医疗设施。根据笔者调研,村级医疗设施与养老设施常近距离设置在村公共服务中心,具备良好的医养结合基础(表2)。

表2 研究数据来源与处理方法
Tab.2 Sources and methods of data processing for the study
资料来源:笔者自绘
2.1.2 基于ID3算法的决策树模型构建
决策树模型是基于已知事件的发生概率,依据信息熵值,求最大净现值的期望值大于零或等于零的概率的监督学习方法。监督学习指通过训练学习部分已知属性与类别的样本,得到样本分类器,并据此对新样本进行分类判断。ID3算法是1975年罗斯 · 昆兰(J. Ross Quinlan)提出的一种分类预测算法,算法的核心是“信息熵”,以信息熵和信息增益为衡量标准,从而实现对数据的归纳分类。
本研究拟根据现状收集数据样本,基于ID3算法的决策树模型进行研究。设有样本数S的样本集S={S1,S2,…,Sn},其决策属性集为D={D1,D2,…,Dm},第j类属性为Dj(j=1,2,…,m),有样本数| Dj |个,则D的信息熵为

式中,第j类的概率为pj,常用样本的个数与总样本数的比值估计。设属性A有集合,设A={A1,A2,…,Ak},其第i个条件属性的取值为Ai(i=1,2,…,k),| Aj | 为该取值的样本数,| Aij | 为Ai下第j类的样本数,那么属性A进行划分后的信息熵为

可计算属性A划分前、后的信息增益:

基于此,依次计算每种属性划分前后的信息增益,然后以信息增益最大的属性为节点,把最具有效分类的属性作为分类条件,反复迭代得到最优决策树模型。
2.2 养老设施选址模拟预测
首先基于ID3算法下训练优化得到的养老设施选址模型,对研究范围进行初步设施选址模拟预测;然后结合床位缺口压力、规划医疗设施服务能力、服务设施便利度进行优化选址;最后结合国土空间总体规划、控制性详细规划及街镇政府的意向落地选址成果(图4)。

图4 研究技术路线图
Fig.4 Research technical roadmap
资料来源:笔者根据三地民政局提供的相关资料改绘
03 三地养老设施选址实践
3.1 三地现状养老设施规律推演
本研究以网格单元内的现有设施作为自变量,以是否有养老设施作为因变量,进行ID3算法下的决策树模型训练,最终得到三地养老设施决策树模型(图5)。为排除训练集与预测集的重叠因素,本研究在三地进行随机等比例抽样,训练集比例定为70%,测试集比例定为30%。经过测试,三地决策树模型的准确率分别为95.28%、97.75%、97.70%,证明模型均有效(表3)。依据ID3算法原理,越是居于上层的属性,对决策的重要度越高。通过分析可知,三地前四层设施的类型在相关13种影响数据类型中的占比达60%以上,其中,崇州市和邛崃市高达76.92%。在养老设施选址影响因素方面,三地均表现出选址和行政机构及社会团体的紧密结合。科教文化服务在崇州市表现明显,与崇州市深厚的历史文化底蕴相契合。购物服务和卫生医疗设施在大邑县和邛崃市表现明显,展现出两地较好的医养结合规划理念贯彻实施基础。

图5 崇州市养老设施决策树模型图
Fig.5 Operation diagram of Chongzhou elderly care facilities decision tree model
资料来源:笔者根据三地民政局提供的相关资料绘制

表3 三地养老设施决策树模型图分析
Tab.3 Analysis of decision tree model for elderly care facilities in the three areas
资料来源:笔者自绘
3.2 三地养老设施选址模拟预测
3.2.1 基于决策树模型的三地养老设施选址初步预测
研究对三地模型分别进行全域模拟预测。通过分析可知,在初步预测选址中,崇州市适宜选址的网格有106个,主要分布在崇阳街道、崇庆街道、怀远镇及羊马街道。大邑县适宜选址的网格有80个,主要分布在晋原街道、青霞街道、安仁街道及沙渠街道。邛崃市适宜选址的网格有76个,主要分布在临邛街道、文君街道和羊安街道(图6)。

图6 三地养老设施选址初步模拟成果分析图
Fig.6 Analysis diagram of preliminary simulation results of site selection of elderly care facilities in the three areas
资料来源:笔者根据三地民政局提供的相关资料整理绘制
3.2.2 初步优化模拟预测结果
为便于将床位缺口压力、规划医疗设施服务能力及服务设施便利度三个因素叠加分析,研究拟通过GIS栅格量化三个因素。
(1)床位缺口压力因素量化分析
按照规划床位千人测算指标和在规划人口的基础上提升20%的配套公共服务设施的要求,同时结合三地2035年人口预测数据及床位需求预测数据,可知三地缺口床位均在7000张以上。其中,崇阳、崇庆街道现状床位缺口高达3650张,在不考量异地养老的情况下,新场镇、隆兴镇、观胜镇、元通镇和文井江镇可不考虑新增床位。基于各街镇缺口床位差异,将其在三地全域进行栅格量化,床位缺口压力从评分值“5”到“1”逐级弱化(图7)。通过分析可知,三地中床位缺口压力偏大(评分值为“4~5”)的街镇占比均高于17%。其中,大邑县占比最高,为25.40%;崇州市占比最低,为17.19%。三地中床位缺口压力偏小(评分值为“1~2”)的街镇占比均高于70%。其中,崇州市占比最高,为78.35%;邛崃市占比最低,为71.70%(表4)。

图7 三地街镇床位缺口压力分析图
Fig.7 Analysis diagram of bed shortage pressure in the three areas
资料来源:笔者根据三地民政局提供相关资料绘制

表4 三地养老床位缺口分析明细表
Tab.4 Detailed table of bed shortage analysis in the three areas
资料来源:笔者根据三地民政局提供相关资料绘制
(2)规划医疗设施服务能力因素量化分析
根据医疗设施服务能力,假定医院值为“100”,基层医疗卫生机构值为“20”。假定医疗设施服务能力随所在地理位置与目标对象之间的距离而减弱,由于三地邻近接壤,本研究基于三地医疗设施共享的考量,利用GIS空间插值反距离权重法,将医疗设施服务能力在三地全域进行量化(图8),服务能力从评分值“5”到“1”逐级弱化。通过分析可知,三地医疗服务能力总体上分布较为均匀,医疗服务能力较强的区域(评分值为“4~5”)占比达39.03%,集中在中心城区;医疗服务能力偏弱的区域(评分值为“1~2”)占比达37.28%,集中在规划老年人口较少的区域以及自然风景名胜区。

图8 三地规划医疗设施服务能力分析图
Fig.8 Service capacity analysis diagram of planned medical facilities in the three areas
资料来源:笔者根据三地民政局提供的相关资料整理
(3)服务设施便利度因素量化分析
研究发现三地的网格单元中现有服务设施数量不均衡。单元网格中设施数量高于500处的网格,崇州市有3个,大邑县有4个,邛崃市有1个。其中,12970号(网络划分后的ID代码)网格的设施数量高达857处。单元网格中设施数量为0的网格,崇州市有2965个,大邑县有4211个,邛崃市有4355个。研究将单元网格中设施数量的分布态势进行栅格化处理,便于后续统计分析,网格设施数量从评分值“5”到“1”逐级递减(图9)。通过分析可知,三地便利度偏高的区域(评分值为“4~5”)占比仅为1.4%,集中分布在中心城区;便利度偏弱的区域(评分值为“1~2”)占比高达95.02%。

图9 三地网格单元设施数量栅格化分析图
Fig.9 Rasterized analysis diagram of facility counts in grid units of the three areas
资料来源:笔者根据高德POI数据和三地民政局提供的相关资料改绘
(4)三因素叠加优化分析
研究将床位缺口压力、规划医疗设施服务能力及服务设施便利度三个因素通过GIS栅格叠加分析(图10)。在总体分布上,三地中评分值为“1”的区域占比为52.29%,评分值为“5”的区域占比为4.59%,大多集中在中适宜度区间。在分区分布上,崇州市评分值为“5”的区域最少,占比仅为2.10%,而评分值为“1”的区域最多,占比为66.81%。大邑县评分值为“1”的区域最少,占比为41.33%。邛崃市评分值为“5”的区域最多,占比为7.86%(表5)。

图10 三地网格单元基于三因素的分析图
Fig.10 Analysis diagram of grid units in the three areas based on the three factors
资料来源:笔者根据三地民政局的提供相关资料改绘

表5 三因素叠加评级分析表
Tab.5 Three factors overlay rating analysis table
资料来源:笔者自绘
研究将上述三个因素的综合分析结果叠加初步模拟预测结果,计算出初步优化选址结果,其网格适宜性评分值从“3”到“1”逐步减弱(图11)。通过对比分析三地优化前、后的结果可知:在高适宜度区域中,邛崃市占比最高,为43.24%;大邑县占比最低,为26.92%。在中适宜度区域中,大邑县占比最高,为35.90%;邛崃市占比最低,为24.32%。在低适宜度区域中,崇州市占比最高,为38.23%;邛崃市占比最低,为32.43%。

图11 三地初步优化选址分析图
Fig.11 Preliminary optimization site analysis diagram for the three areas
资料来源:笔者根据高德POI数据和三地民政局提供的相关资料改绘
3.2.3 结合传统选址方法
研究认为,选址结果的进一步优化仍需结合传统选址方法(图12)。首先,根据三地国土空间总体规划中城镇开发边界进行二次优化;其次,结合不同类型养老设施对应的用地性质,以及现行控制性详细规划中社会福利设施用地、商业设施用地、居住用地的布局优化选址;最后,融入街镇政府意向落地选址成果。受数据颗粒度的影响,本研究仅做开发边界的优化结果处理。优化后三地的选址网格共减少83个,在高适宜度区域,崇州市占比超过50%;大邑县和邛崃市两地占比近40%。在中适宜度区域,邛崃市占比最低,为20.75%;大邑县占比最高,为37.7%。在低适宜度区域,邛崃市占比最高,为39.62%;崇州市占比最低,为19.3%(表6)。

图12 三地开发边界叠加优化选址分析图
Fig.12 Overlay optimization site selection analysis diagram for development boundaries in the three areas
资料来源:笔者根据三地民政局提供的相关资料改绘

表6 初步优化结果及开发边界优化结果分析表
Tab.6 Analysis table of initial optimization results and development boundary optimization results
资料来源:笔者自绘
04 结论
本研究首先基于高德API平台采集的相关服务设施数据,采用ID3算法下的决策树模型,对三地现状养老设施分布规律进行推演,训练优化得到准确率达90%以上的三地决策树模型;然后以该模型进行三地初步定量模拟,并选取床位缺口压力、规划医疗设施服务能力、服务设施便利度三个因素进行选址优化;最后结合三地的国土空间总体规划、控制性详细规划及街镇政府意向,进一步加强选址成果的落地性。目前,研究成果仍存在一定的局限性,在初步调研街镇意向后,本研究选址优化阶段综合考量的三个因素选择均等权重,但在不同地区应进行权重分配,这可以作为下一步研究的探索方向。

