首页 | 本学科首页   官方微博 | 高级检索  
     

海量公交数据的人群画像算法
引用本文:张锦,张建忠,汪飞,郭芊. 海量公交数据的人群画像算法[J]. 国防科技大学学报, 2023, 45(2): 55-64
作者姓名:张锦  张建忠  汪飞  郭芊
作者单位:湖南师范大学信息科学与工程学院,湖南长沙 410006;长沙理工大学计算机与通信工程学院,湖南长沙 410114;湖南师范大学信息科学与工程学院,湖南长沙 410006;湖南师范大学 数学与统计学院,湖南 长沙 410006
基金项目:国家部委基金资助项目(31511010105);湖南省自然科学基金资助项目(2021JJ30456)
摘    要:面向海量公交数据的人群画像对分析城市群体出行特点、交通态势等极具价值,但对数据的处理存在耗时高、质量低、解释难等问题。提出一种海量公交数据人群画像的系统化解决策略,基于PageRank算法筛选出经过重要站点的人群轨迹,极大减少目标人群的轨迹数据;提出轨迹文本化分析方法来提高人群画像的可解释性;分析确定基于余弦距离的K-means算法作为人群画像分类的聚类算法。该算法在3 000万乘客公交出行数据上的实验表明:提出的解决策略能够较为系统性地解决海量公交数据的人群画像问题,同时基于余弦距离的K-means算法的聚类效果最好且准确率约达80%。将人群画像及其轨迹使用Flow Map进行可视化展示,结果符合真实世界的人群行为特征。

关 键 词:人群画像  PageRank算法  轨迹文本化  文本聚类
收稿时间:2021-02-26

Crowd profiling algorithm mass transit data
ZHANG Jin,ZHANG Jianzhong,WANG Fei,GUO Qian. Crowd profiling algorithm mass transit data[J]. Journal of National University of Defense Technology, 2023, 45(2): 55-64
Authors:ZHANG Jin  ZHANG Jianzhong  WANG Fei  GUO Qian
Affiliation:College of Information Science and Engineering, Hunan Normal University, Changsha 410006, China;School of Computer and Communication Engineering, Changsha University of Science and Technology, Changsha 410114, China;School of Mathematics and Statistics, Hunan Normal University, Changsha 410006, China
Abstract:
Keywords:crowd portraits   PageRank algorithm   trajectory textualization   text clustering
本文献已被 万方数据 等数据库收录!
点击此处可从《国防科技大学学报》浏览原始摘要信息
点击此处可从《国防科技大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号