
第二部分 流动人口服务与管理
大数据在流动人口服务中的应用
肖子华
摘要:大数据是一种宝贵的资源,流动人口大数据正成为发现问题、把握规律、科学决策和精准管理的重要依据。流动人口大数据具有数据量大、来源广泛、层级复杂、特色鲜明、缺乏共享等特点。流动人口大数据在服务管理中可以发挥现状分析、趋势预测、决策支持、精准服务、绩效评价、智能匹配等作用。为使流动人口大数据更好地服务流动人口,应整合数据资源、促进数据开放共享,搭建流动人口数据平台,采用新技术开展流动人口动态监测并利用多种方法对流动人口大数据进行分析。
关键词:大数据 流动人口大数据 流动人口 服务管理
当今时代,大数据是当之无愧的热门词汇。大数据是人们分析和解决问题的重要抓手,也是决策、服务、评估、预测的重要依据,已逐渐成为关键性的生产要素及战略性资源。2015年8月31日,国务院印发《促进大数据发展行动纲要》,提出要全面推进大数据发展和应用,加快政府数据开放共享,深化大数据在各行业的创新应用,通过建设数据强国,提升政府治理能力、推动经济转型升级,这意味着大数据发展正式上升到国家战略层面。技术在进步、观念在更新,流动人口大数据也将帮助我们更加有效地服务流动人口,预测流动人口发展趋势,指导流动人口服务管理政策的科学调整,为人口合理分布、有序流动提供重要参考。
一 流动人口大数据的来源
(一)国家人口基础信息库
长期以来,按照政府机构设置和职能分工,我国包括流动人口信息在内的各类人口信息建设和管理任务分散于公安、人口和计划生育、人事、劳动和社会保障、民政、教育、税务、卫生、统计等众多部门(王占宏、鲁明,2011)。2002年8月,中共中央办公厅印发的《国家信息化领导小组关于我国电子政务建设指导意见》(〔2002〕17号)明确提出启动建设人口基础信息库。经过十多年的建设,人口信息系统的建设和应用已具有一定的基础。2014年《国务院关于进一步推进户籍制度改革的意见》再次明确要建立国家人口基础信息库,建立健全实际居住人口登记制度,加强和完善人口统计调查,全面、准确掌握人口规模、人员结构、地区分布等情况;建设和完善覆盖全国人口、以公民身份证号码为唯一标识、以人口基础信息为基准的国家人口基础信息库,分类完善劳动就业、教育、收入、社保、房产、信用、卫生计生、税务、婚姻、民族等信息系统,逐步实现跨部门、跨地区信息整合和共享,为制定人口发展战略和政策提供信息支持,为人口服务和管理提供支撑。“十三五”规划再次明确“建立国家人口基础信息库”。国家人口基础信息库建设由公安部牵头,国家卫生计生委、国家统计局等作为成员单位参加。
(二)人口普查数据
人口普查是全国基本人口数据(人口数量、人口素质、人口结构、人口分布)的主要来源,也是全面把握我国流动人口规模、结构、流向等基本状况的重要来源。新中国成立以来,我国先后于1953年、1964年、1982年、1990年、2000年、2010年进行了六次全国人口普查。其中,流动人口研究使用较多的是1990年、2000年和2010年普查数据,以2000年第五次全国人口普查数据使用的频率最高(张展新、杨思思,2013)。自1990年第四次全国人口普查开始,普查项目增加了五年前常住地状况和迁移原因两个项目。同时,在户口状况项目中,增加了户口性质属农业户口或非农业户口的内容。人口普查数据户口状况中包含本省跨区县和省外流动人口基本特征数据,反映了流动人口的基本情况。
(三)全国性大型人口抽样调查数据
国务院2010年颁布的《全国人口普查条例》规定,人口普查每10年进行一次,个位数逢0的年份为普查年度,在两次人口普查之间开展一次较大规模的人口调查,也就是1%人口抽样调查,又称为“小普查”。我国分别在1987年、1995年、2005年、2015年进行过四次1%人口抽样调查。抽样调查中包含的流动人口相关数据与全国人口普查数据内容类似。该调查覆盖全国,样本量极大,有类似于人口普查数据的收集人口统计信息的功能。其中,2005年1%人口抽样调查被广泛应用(张展新、杨思思,2013)在人口流向、分布、省际迁移流动(段成荣、杨舸,2009;孙祥栋、王涵,2016)等研究中。
(四)流动人口动态监测调查数据
自2009年开始,原国家人口计生委每年进行一次流动人口动态监测调查,迄今已经进行8年。国家卫生计生委流动人口服务中心自2014年起,承担了全国流动人口动态监测调查数据整理开放工作,已经对2009~2015年共7年的全国流动人口动态监测调查的140多万个样本约6.7亿个数值进行了标准化整理,形成分年度数据,并免费向社会开放。中心分别于2014年12月、2015年11月、2016年12月,在北京举办三次流动人口动态监测数据开放说明会,向社会公布当年度流动人口动态监测数据申请与发放情况。截至2016年10月,已有22个省区市的400多家科研机构申请使用监测数据并实施开发利用,迄今取得了500多项科研成果。
(五)全国农民工监测调查数据
国家统计局于2008年建立了农民工监测调查制度,调查范围是全国31个省(自治区、直辖市)的农村地域。2014年在1527个调查县(区)抽选了8930个村和23.5万名农村劳动力作为调查样本。每年进行一次,采用按季度入户访问的方式在农民工输出地进行抽样监测调查。该调查以农村住户为调查对象,通过访问农村住户中的户主或了解情况的家庭成员获得农民工的有关情况,能准确反映农民工的总量及流向分布;但对于反映农民工本人在外工作及生活的各种情况,可能存在一定程度的误差。为准确反映农民工市民化现状,从2015年开始,国家统计局还在城镇开展了农民工市民化进程动态监测调查,以更加全面、科学地反映我国农民工的情况。
(六)大城市与各地区的小型流动人口调查数据
大规模的人口流动迁移给各地区和各大城市的发展带来了机遇与活力,也给各地政府和大中型城市的社会管理和公共资源配置带来了巨大压力和挑战。各地政府职能部门和相关科研机构就流动人口的基本特征、流迁态势、演变趋势和生存发展等方面开展了调查研究,分析流动人口的基本状况、就业生活、社会融合和社会参与等方面的数据,形成调查报告。例如,教育部2004年社会科学重大招标课题“西部开发中的人口流动与族际交往研究”,在西部6个城市(乌鲁木齐、拉萨、西宁、格尔木、兰州、银川)组织了以城市流动人口为对象的问卷调查。2012年中国人民大学在北京组织开展了流动人口生存状况调查。北京市人口研究所于2011年和2013年对北京市东城区和通州区流动人口进行了生育意愿调查。
(七)高校、科研机构掌握的流动人口调查数据
中国人民大学、复旦大学、中山大学、暨南大学、西南财经大学等不少高校设立的社会科学调查中心都有流动人口调查的相关数据。如中国人民大学中国调查与数据中心的中国综合社会调查(CGSS),涉及了人口迁移、流动相关内容。复旦大学社会科学数据平台也包含流动人口相关专题调查数据。中山大学建立了“城市农民工调查数据库”。暨南大学经济与社会研究院社会调查中心也开展了多项大型社会调查项目,其中包括流动人口与儿童发展调查。澳大利亚国立大学孟昕教授于2008年发起“中国城乡劳动力流动调查”(Rural-Urban Migration in China,简称RUMiC),2016年该调查由暨南大学和澳大利亚国立大学合作完成,从2017年开始,暨南大学经济与社会研究院将与国家卫生计生委流动人口服务中心共同实施该调查项目。
(八)企业收集的流动人口数据
移动通信、交通、社交网络(包括QQ、微信用户登录数量)等统计信息,有比较准确的人口分布及流动数据。据工业和信息化部统计,截至2015年12月,我国移动电话总数达13.06亿户,移动电话用户普及率达95.5部/百人,接近人手一部手机。对于流动人口而言,无论其流动方向如何,总会通过移动通信设备与家里留守的亲人保持联系,所以流动人口的统计特征与移动通信数据基本保持一致。
随着大数据逐渐成为企业标配,企业管理层将注意力从大数据的宣传转移到它的实际价值上来。因此,商业类国有企业、公益类国有企业、私营企业等均拥有大量的流动人口数据。2016年上半年,中国城市规划设计研究院与腾讯云联合开展了一项基于LBSN数据的全国人口分布与流动的重要研究工作。基于腾讯云团队的数据基础与技术力量,他们开展了逃离北上广、春节去哪儿、十一国庆旅游分析以及城市拥挤预警等一系列研究工作。
二 流动人口大数据的特点
(一)数据量大
流动人口大数据的一个重要特征是数据量大。我国是世界上人口最多的国家,在户籍制度的影响及制约下,我国正经历着历史上最大规模、最长时间的人口流动。《中国流动人口发展报告2016》的数据显示,2015年中国流动人口规模高达2.47亿人,占总人口的18%,相当于每6个人中就有1个流动人口。同时,我国互联网、移动互联网的用户数也居世界前列,因此我国也是产生流动人口数据量最多的国家(李红娟,2014)。
(二)来源广泛
我国的人口大数据主要来自人口普查、人口信息管理系统和行政登记,根据收集方式的不同,又可划分为全员人口大数据和特定人群大数据。全员人口大数据主要是人口普查信息和户籍管理信息,而特定人群大数据有婚姻登记、出生登记、学籍登记等(王广州,2015)。如民政部门基于婚姻登记系统,收集了全国20岁及以上女性和22岁及以上男性的信息。卫生计生部门通过出生登记系统,对人口出生时间、性别、国籍等进行了详细的记录。教育部通过学籍登记系统,掌握了全国超过1.6亿名中小学生的信息。另有相关部门通过住房产权、社会保障等系统,分别收集、储存了海量的人口信息。相应地,我国流动人口大数据亦可通过人口普查、人口信息管理系统和行政登记活动采集。除此之外,我国流动人口数据还产生于抽样调查、专题调查以及移动通信、交通、社交网络等各种途径。
(三)层级复杂
我国流动人口数据层级非常复杂,从以下两方面可以看出。
一是数据产生的领域。我国的人口流动迁移涉及多种原因,包括经济类流动(务工经商)、节日类流动(过节返乡旅游);在流动时长方面,可分为长期流动与短期流动;在流动范围方面,可分为县内流动、市内流动、省内流动、跨省流动、跨国流动等;在流动区域性质方面,可分为乡城流动、城乡流动和城城流动。流动人口的群体划分存在诸多变数,因此对应的数据也具有相对繁多且鲜明的特色。不同的流动人口数据,因其对应群体的不同,往往在时效、结构、核心内容等方面呈现不同的特点。其变化之多、涉及之广、结构层级之复杂,难以用一套简单系统归纳处理。
二是流动人口数据收集的源头。我国人口数据收集的源头,由多个政府部门组成,包括统计部门、公安部门、民政部门、人社部门、卫生计生部门、教育部门等。同时,各省、市、县等地方亦逐步形成了自有的人口信息采集与处理系统。由于工作性质和信息需求的不同,不同部门收集的人口数据均带有鲜明的“部门特色”,这一点从数据的内容偏好可以看出。如教育部门的人口数据,更多地关注人口的教育信息;而卫生计生部门的人口数据,则偏好对人口的出生/死亡信息、婚育信息、健康信息等进行呈现。这些数据种类繁多、层级复杂,共同构成了量级庞大又各不相同的数据海。
(四)特色鲜明
我国流动人口大数据呈现就业型、节日型、乡城流动与城城流动型三个鲜明的特色。
一是就业型。国外人口流动以旅游、商务等短期性流动为主,而国内则以就业性的人口流动为主,且在时间跨度、距离跨度和数量方面都远胜全球任何一个国家(周晓津、姚阳,2016)。
二是节日型。春运是我国城镇化进程中特有的社会现象,被称为人类历史上规模最大的周期性人口迁徙。来自北京市交通委员会的信息表明,2015年春运40天(2月4日至3月16日),北京铁路、民航、公路省际客运进出京客流总量达3999.23万人次。通过大数据分析表明,进出京客流总量中,30.225%的客流属于日常性流动,69.775%属于外来人口返乡(入城)流动。交通运输部的数据显示,2016年春节,全国旅客发送量达到29.1亿人次。
三是乡城流动与城城流动型。由于户籍类型与户籍地点的不同,我国的流动人口被区分为乡城流动人口与城城流动人口,即从乡村流向城镇的流动人口和从城镇流向城镇的流动人口。
(五)缺乏共享
我国流动人口大数据虽然数量庞大、来源广泛,但由于收集、储存源头涉及多个部门,尚存在各自为政的情况。在流动人口管理与服务中,公安、卫生计生、人社、民政各部门以及各地方都基于各自的方向,有选择、有侧重地收集和整理了流动人口相关数据,每个部门和地方根据需要建有自己的信息系统和数据库,彼此之间较少开放共享,形成“数据烟囱”林立、“数据孤岛”频现的局面。同时,数据的收集和整理缺乏整体设计和协调,使得相关数据既有重复,又存在空白,产生了大量的无用数据。特别是各部门各自为政,缺乏共享机制,使得数据之间不能进行有效链接和交换,难以形成完整的流动人口信息系统(李宇,2014;彭慕莉,2016)。截至目前,我国尚未形成一个统一的,整合多部门、多领域人口尤其是流动人口大数据的系统,流动人口大数据尚未得到科学系统的整合。
三 流动人口大数据的作用
近几年来,随着互联网的大力普及、信息技术的飞速发展和网民规模的巨幅增长,大数据的作用日渐显现。大数据分析在提供数据支撑、提升区域人口服务及动态监测工作效率、缩短人口调控决策时间周期等方面日益发挥重要的作用(孙卉,2015),既可以有效推动政府工作的开展、提高政府决策水平,又能够充分提高服务效率及社会管理水平。
(一)现状分析:做到心中有数
大数据最重要的价值在于通过对海量数据的充分整合、分析处理、深入挖掘与有效利用,可以厘清并有效把握现状、提高分析预测的精准性,从而对某个问题、某些现象能够做到整体把握、心中有数。随着新型城镇化的不断推进、人口再生产类型的转变以及生育政策的调整完善,我国人口流动迁移出现了许多新情况、新特点。通过对流动人口大数据的分析,把握流动人口发展的最新状况、特点以及面临的新问题、新形势,可以摸清流动人口问题底数,明晰流动人口发展的情况。
(二)趋势预测:做好研判、完善管理
大数据分析的重要应用领域之一就是预测性分析。从大数据中挖掘出特点,建立科学模型代入新的数据,从而预测未来的情况。实时追踪的人口大数据既可以研究个体层面人口流动迁移的历史,也可以研究家庭、家族以及社区层面的社会关系,还可以从更大尺度和空间研究人口迁移流动的格局和模式,进行冷点与热点分析(王广州,2015)。同时,还可以对流动人口发展趋势进行预测,采取有效的应对措施,完善流动人口服务管理,做好资源的优化及合理配置。
(三)决策支持:提供有价值的数据支撑
利用大数据可以帮助政府及时发现问题、预判态势,选择最重要的问题作为切入点,将有限的资源投入重点方向,大大提高政府决策的前瞻性,解决政策滞后的难题,提高政府决策效率。比如,2015年12月31日发生的上海外滩踩踏事件,如果政府能够对热点地区人流大数据进行分析,就有可能避免惨剧的发生。另外,利用大数据还可以对需要解决的问题进行建模、分析,提高政府决策的科学性,脱离凭直觉和经验来决定政府重点工作方向的做法。比如,利用流动人口分布、活动、人群特征等大数据分析,政府就可以在水、电、气等基础条件配备和医疗、教育、消防等公共服务供给方面采取更有效率的配置。通过对流动人口大数据分析,可以深入了解不同因素对流动人口生存发展及社会融合的影响,把握社会融合的深层机制及流动人口问题的主要矛盾,为制定、完善社会政策提供科学的、有价值的数据支持。
(四)精准服务:强化服务的科学性、针对性
流动人口的情况相当复杂而且内部差异很大(王培安,2015),乡城流动人口与城城流动人口、在婚人群与未婚人群、老生代流动人口与新生代流动人口、汉族流动人口与少数民族流动人口等,不同的流动群体对公共服务的诉求不同。只了解共性,不了解个性,公共服务供给就容易错位、缺位。因此,精准分析不同流动群体对公共服务的具体需求,设计开展定制服务,可以变后端治理为前端治理,强化公共服务的科学性和前瞻性(唐璐,2014)。利用大数据,可以分析用户的个性化需求,提供个性化产品和精准服务。在商业领域,企业利用百度、腾讯、阿里巴巴等搜索、社交和交易平台收集海量用户的互联网行为数据,将用户分类,根据类型提供个性化产品。政府也可以利用自身或互联网公司的大数据,对受益人群(如流动人口高龄产妇)精准定位并提供相关服务。
(五)绩效评价:提高工作积极性、创新服务模式
利用大数据和互联网信息技术,可以便捷地实现公众对公共服务部门的评价。通过构建指标体系,借助相应的数据分析,可以对流动人口相关政策、措施、服务管理的效益等进行绩效评价,总结经验教训,分析利弊得失,提升各地流动人口服务管理工作的积极性,创新服务管理模式。比如,国家卫生计生委流动人口服务中心开发的流动人口公共服务平台就有定位和评价功能。在基层政府窗口办事的流动人口可以使用手机定位到办事大厅并对相应的服务进行评价。平台会自动将评价信息汇总,然后发给上级政府监督部门参考。
(六)智能匹配:寻找较为理想的流动迁移目标城市
智能匹配是利用供方或需方的大数据信息,针对各方的偏好进行相应的匹配互动。一些大型婚恋网站通过海量信息挖掘用户行为数据,比如点击哪些异性的页面,发表什么样的评论,建立用户兴趣模型,从而挖掘到用户所期待的另一半的类型,然后主动推荐匹配度比较高的人选。在流动人口服务方面,也可以应用。比如,流动人口公共服务平台可以利用大数据来匹配医疗机构,为其医疗出行提供个性化、经济的适合方案。也可以通过流动人口社会融合评估数据,找到符合流动迁移目标的理想城市等。
四 公共网络平台的流动人口大数据
(一)流动人口大数据的收集
大数据收集及运用的流程如下:数据收集→数据存储→数据分析处理→数据展现(可视化)。数据收集是数据开发、整合、利用的前提(林艳艳,2015)。大数据既有结构化的数据又有大量的非结构化、异构的数据,涵盖网络日志、视频、音频、图片、地理位置信息等,对数据进行关注并努力找出事实依据,这是收集大数据的重要基础(朱志萍,2016)。流动人口大数据的收集,一是利用政府数据开放平台。如浙江政府数据开放平台,包括68个省级单位提供的350项数据类目,涵盖工商、税务、司法、交通、医疗、教育等多个民生领域。其中包含100项可下载的数据资源,137个数据接口和8个移动App应用,用户可以通过该网站打包下载或利用接口进行二次开发。二是通过网络爬虫或网站公开API的方式将非结构化的流动人口数据从网页中抽取出来。如通过各大中介网站抓取租房数据,了解流动人口租房信息、不同地区流动人口的房租收入比。三是可以通过与企业或研究机构合作,使用特定系统接口采集数据。如国家卫生计生委与百度的合作,可以收集流动人口健康大数据信息。但是我们应该注意流动人口大数据的多源及异构性,在数据收集过程中,要制定完整规范的数据管理体系,即数据的采集流程和管理都要标准化。
(二)流动人口大数据的整理
大数据的多源性、异质性以及采集数据时的人工错误,导致初始数据是冗余、含噪音和有缺失的(王元卓等,2013),为保证数据的质量及可信性,需要对这些数据进行整理与清洗。首先需要将收集到的结构复杂的流动人口数据转换为单一的或是便于处理的结构(刘智慧、张泉灵,2014),对多维、多尺度的数据、指标进行标准化和规范化的处理,从而提高数据的可比性、可交换性和可利用性(郑晓瑛等,2014)。在此基础上,需要对数据进行清洗去噪,发现并纠正数据中可识别的错误,去掉无用的干扰性数据,包括去掉重复数据、处理无效值和缺失值等。大数据时代,数据的清洗过程要更加谨慎,清洗过细容易将有用的信息过滤掉,清洗过粗又难以达到效果,因此,要在质与量之间进行仔细考量和权衡(孟小峰、慈祥,2013)。
(三)流动人口大数据的分析挖掘
数据挖掘的实际应用功能分为三大类和六个小项。一是分类去隔类,包含分类和聚类;二是推测预测类,涵盖回归和时间序列;三是序列规则类,包括关联和序列(孙勤红、沈凤仙,2016)。大数据不仅要利用数据挖掘技术获取信息,而且要以直观方式展示数据间的联系和变化,快速抓住重点、要点,更准确、更简洁、创新性地表达海量信息。目前,互联网中有很多数据可视化工具,包括iCharts、Modest Maps、Leaflet、Many Eyes、Google Charts、Fusion Charts等。流动人口大数据通过应用的不同功能及可视化技术,将流动人口的最新状况与特点、经济融合、社区融合、心理文化融合等不同维度的情况以及分区域的流动人口状况等更直观地展现出来。
五 流动人口大数据的应用
(一)搭建流动人口数据平台,整合流动人口大数据
如前所述,我国各级政府部门在流动人口服务管理中积累了大量的数据,如统计部门的人口普查和“小普查”数据,公安部门的户籍人口数据,民政部门的婚姻、死亡登记数据,卫生计生部门的出生人口登记、住院分娩登记、健康档案、医疗数据、跨省流动人口等数据,各高校、科研机构以及企业采集、汇总的丰富的流动人口数据资源。要有效整合、利用这些资源需要从两个方面着手。一是推动政府人口数据共享。除涉及国家安全、商业秘密、个人隐私以外的数据,都应向社会开放。二是要促进公共数据资源的开放互通,真正实现“人在干、数在转、云在算”(王培安,2015),形成常态化的共享机制,构成纵向呈树、横向呈星的全覆盖数据网络和基础数据共享信息平台(李宇,2014)。
国家卫生计生委流动人口服务中心在整理历年流动人口动态监测调查数据的基础上,结合我国人口科学研究领域的实际需求,建设了流动人口数据平台,这是一个具备数据收割、数据共享、数据分析、数据储存、数据应用和数据出版六大功能的数据交换与共享平台。目前,平台已开放全国流动人口动态监测调查数据的申请,通过在线下载的形式实现数据资源的快速发放,以提高数据开放工作的信息化水平。未来,平台还将围绕功能创新、用户体验优化等内容进行探索,更好地支持相关领域的政府决策与学术研究。
(二)摸准流动人口需求,为流动人口提供精准化服务
大规模的人口迁移在推动经济增长、缩小地区差距、改变人口分布格局的同时,给政府公共服务和社会管理带来了巨大压力和严峻挑战。通过对数据的实时更新以及分析处理,及时把握流动人口的重点需求,可以提供有针对性的高效服务。例如,对流动人口的服务管理过去凭借户口登记,难以及时更新区域人口及分布状况,使工作人员的调整无法适应真实的状况,借助流动人口大数据,有关部门能够及时掌握流动人口的第一手信息,方便对流动人口进行管理和服务,更好地推动城市特别是大城市的服务管理。如贵州省贵阳市云岩区的新市民服务管理综合平台,运用网络管理平台“BI分析”和手机端App数据分析及录入等功能,通过“数据化记录、网络化连接、融合化分析、实时化反馈”,依托大数据分析,有针对性地指导工作,大力解决流动人口在劳动就业、教育培训、法律援助、医疗卫生等方面的困难,实现精细管理与精准服务。
(三)开展流动人口社会融合评估等政府绩效评价活动
流动人口社会融合是一个伴随城镇化、工业化、信息化、农业现代化进程的不可逆转的趋势,开展流动人口社会融合评估是促进流动人口基本公共服务均等化,引导流动人口有序流动、合理分布的重大课题(肖子华,2016)。自2016年起,国家卫生计生委流动人口服务中心联合相关科研机构研究开展“中国城市流动人口社会融合评估”工作。主要利用“六普”流动人口数据、城市统计年鉴数据、部分城市问卷调查数据、流动人口动态监测调查数据等,对不同类型城市流动人口社会融合的规律和特点进行分析,按照制度融合、经济融合、社区融合、心理文化融合四个维度的指数得分情况,对50多个被评估城市进行排名,同时发布《中国城市流动人口社会融合评估报告》。今后,每年将选取部分城市进行评估,总结并借鉴先进经验,推动各地流动人口社会融合及流动人口管理与服务水平的提升。
(四)把握流动人口发展状况及规律,预测流动人口发展趋势
通过对流动人口大数据的比对分析,尤其是时间序列分析,可以比较清楚地看到人口流量、流向变化,把握人口流动的发展状况及规律,指导流动人口服务管理工作和预测工作方向。如河南省对全省流动人口信息管理系统已有的1050万名流动人口的个案信息整合,并进行对比分析,全面把握河南省人口流动现状(总量、结构、分布等),测算2020~2030年河南省流动人口变动趋势。在此基础上,课题组对河南省流动人口在流入地生存、发展和享受基本公共卫生服务的情况进行专题调查,并判断分析他们对经济社会产生的影响,包括对卫生计生公共服务、劳动力与产业结构调整、人口老龄化、脱贫攻坚、人口健康、农民工、城镇流动儿童、农村留守儿童及留守老人等一系列问题的研究,从而提出在当前形势下促进河南省流动人口服务管理、促进实现“两个一百年”目标的政策建议。
(五)开展流动人口动态形势分析
传统的人口流动行为研究往往采用现场观察、问卷调查、座谈访谈等人工手段,成本高但效率不高(包婷等,2015)。随着社会信息化进程的加速及移动互联网、物联网和云计算等业务的不断发展,基于移动通信大数据进行人口动态监测和分析研究将得到越来越广泛的应用及发展。移动通信大数据快速、准确获取流动人口数据信息,有效减少了人力、物力投入。如北京市海淀区统计局创新性地采用基于移动通信的大数据分析,进行人口动态监测和分析研究。通过大数据技术,利用协同定位算法模型、人口属性识别模型、人口流动分析模型等方法,可以掌握特定地区的人流量、瞬时人口、高峰和低谷时段人口情况、住房腾退后人口变动数量、人口流向地等详细动态信息。此外,通过一段时期的监测和计算,积累的数据同样能够得出全海淀区和各街镇辖区居住人口总量等相对静态的信息。此外,2014年中央电视台与百度公司合作,启用百度地图定位可视化大数据,播报春节期间人口迁徙情况,展现了春节前后人口大迁徙的轨迹与特征。
参考文献
包婷、章志刚、金澈清,2015,《基于手机大数据的城市人口流动分析系统》,《华东师范大学学报》(自然科学版)第5期,第162~171页。
段成荣、杨舸,2009,《我国流动人口的流入地分布变动趋势研究》,《人口研究》第6期,第1~12页。
李红娟,2014,《大数据时代下的人口信息管理及应用探析》,《现代管理科学》第10期,第111~113页。
李宇,2014,《大数据背景下政府信息资源管理的探索与思考——以流动人口信息管理为例》,《电子政务》第7期,第100~104页。
林艳艳,2015,《大数据助推政府治理变革研究》,《中国管理信息化》第23期,第159~160页。
刘智慧、张泉灵,2014,《大数据技术研究综述》,《浙江大学学报》(工学版)第6期,第957~972页。
孟小峰、慈祥,2013,《大数据管理:概念、技术与挑战》,《计算机研究与发展》第1期,第146~167页。
彭慕莉,2016,《大数据背景下城市流动少数民族管理与服务研究》,《经营管理者》第10期,第261~262页。
孙卉,2015,《海淀人口监测用上大数据》,《北京日报》10月8日,第6版。
孙勤红、沈凤仙,2016,《大数据时代的数据挖掘及应用》,《电子技术与软件工程》第6期,第204页。
孙祥栋、王涵,2016,《2000年以来中国流动人口的流入地分布特征演变》,《人口与发展》第1期,第94~104页。
唐璐,2014,《大数据时代人口管理的发展趋势》,《现代经济信息》第19期,第165页。
王广州,2015,《大数据时代中国人口科学研究与创新》,《人口研究》第5期,第15~26页。
王培安,2015,《推进新型城镇化和流动人口社会融合》,《社会治理》第4期,第15~18页。
王元卓、靳小龙、程学旗,2013,《网络大数据:现状与展望》,《计算机学报》第6期,第1125~1138页。
王占宏、鲁明,2011,《人口信息数据集成模型研究》,《计算机应用与软件》第2期,第152~154页。
肖子华,2016,《习近平流动人口社会融合思想研究》,《人口与社会》第3期,第37页。
张展新、杨思思,2013,《流动人口研究中的概念、数据及议题综述》,《中国人口科学》第6期,第102~112页。
郑晓瑛、刘玉博、武继磊等,2014,《人口健康测量与大数据标准研究回顾》,《人口与发展》第1期,第42~49页。
周晓津、姚阳,2016,《基于大数据的京沪人口流动流量、流向新变化》,《大数据》第3期,第49~59页。
朱志萍,2016,《大数据环境下的社会公共安全治理》,《上海公安高等专科学校学报》第1期,第90~96页。
(原载《人口与社会》2017年第2期)