众包任务定价运用于项目定价规律

发表时间:2021/6/15   来源:《科学与技术》2021年第29卷2月5期   作者:朱伟 指导教师:强静仁 冯浩
[导读] 随着信息技术与智能移动终端的飞速发展和普及,“互联网+”
        朱伟 指导教师:强静仁 冯浩
        武汉学院信息工程学院
        摘要:随着信息技术与智能移动终端的飞速发展和普及,“互联网+”时代飞速到来,人们开始新的生活方式。同时也为软件开发模式带来了革新的机遇,本文中提到的是一款通过拍照赚钱来完成任务赚取酬金的自助服务模式,平台的运行核心为APP, 不同于传统的市场调查方式,APP中的核心要素是任务定价。当此任务的任务定价相对较高时,会员会更倾向于进行该任务的调查,因此,我们对定价因素与会员完成情况进行了分析,从而更加节约总任务成本,又使不同地区会员倾向于接取发布的任务。
        关键词:互联网+ 软件众包 聚类分析 动态规划层次分析法 数据挖掘


       


一、问题重述
        随着信息技术与智能移动终端的飞速发展和普及,“互联网+”时代飞速到来,人们开始新的生活方式。同时软件开发模式带来了革新的机遇,通过拍照赚钱来完成任务赚取酬金的自助服务模式的APP,其核心要素是任务定价。
        针对问题一,我们使用BDP(商业数据平台)对附件一中的各个变量进行了绘图,定位,进行数据预处理去除异常数据,发现未完成区域多集中在广州市的白云区,佛山市和深圳市。衡量数据点间的相似性,采用数据挖掘中最远距离函数进行相似性度量,通过任务执行情况和任务标价的之间的关联图采用R型聚类分析的方法,得到任务未完成是任务价格,天气原因,地理位置,人口密度,突发状况为辅的五个因素所决定的。
        针对问题二,影响定价的因素是多样的,总结了九个因素,更全面的分析问题,据此来制定新的定价方案。因此采用了层次分析法来构建数学模型,对找到的因素进行了层次分析,得到了其在新的定价方案中的权重。最后将新的方案和原方案进行比较,虽存在着误差,可以增加会员的任务完成度。
        针对问题三,随机抽取某段交通网络系统,并在附件二数据中随机抽取20名会员,根据其到任务点的实际距离建立模型,通过对模型的求解得出最优调度。据此,可以在任务打包分配的时候使用该模型,减少了任务时间,提高了效率,增加任务完成的成功率。
        针对问题四,采用了层次分析法数学模型得到的新定价方案,对附件三中的部分数据进行了处理将得到的数据与附件一中提供的真实数据进行了比较,发现该方案实施效果较好。未完成任务较多的区域的价格稍高,一定程度上可以增加任务的完成率。
        局部灵敏度分析法对其进行分析,发现虽然经过改进,但任务复杂状况依然影响任务的完成度,虽然灵敏度与地理位置有较大关系,但是当任务复杂度较低时,地理位置对任务完成度的影响较大,而其他因素对任务完成度的影响不大。
        地理信息数据,主要以大地坐标为基础,即地球经纬度。经纬度数据的处理及可视化,与常见的平面坐标数据具有较大的差异,处理起来也相对复杂。本章基于众包平台的任务数据和注册会员数据,介绍了基于经纬度的地理信息可视化、距离与相关特征指标的计算、模型的构建与实现等,从而为地理信息数据的处理及建模提供一定基础。下面将从案例背景、案例目标及实现思路、数据获取、数据可视化、指标计算、模型构建与实现等方面进行详细介绍。
二、 案例背景
“拍照赚钱”是移动互联网下的一种自助式服务模式。用户下载App,注册成为App会员,然后从App上领取需要拍照的任务(如去超市检查某种商品的上架情况),赚取App对任务所标定的酬金。这种基于移动互联网的自助式劳务众包平台为企业提供各种商业检查和信息搜集服务,相比传统的市场调查方式可以大大节省调查成本,而且有效地保证了调查数据的真实性,缩短了调查周期。因此App成为该种平台运行的核心,而App中的任务定价又是其核心要素。如果定价不合理,则有的任务就会无人问津,从而导致任务的失败。附件一是一个已结束项目的任务数据,包含了每个任务的位置、定价和完成情况(“1”表示完成,“0”表示未完成);附件二是会员信息数据,包含了会员的位置、信誉值、参考其信誉给出的任务开始预订时间和预订限额,原则上会员信誉越高,越优先开始挑选任务,其配额也就越大(任务分配时实际上是根据预订限额所占比例进行配发的)。附件一和附件二的表结构如表1和表2所示。

三、案例目标及实现思路
本案例的主要目标包括掌握地理信息数据可视化基本技能,根据实际问题提炼分析指标并编程计算,构建分析模型及实现。基本实现思路如下图1所示。


四、 数据获取与探索
        主要通过Python读取附件一的任务数据和附件二的会员数据,并将任务和会员的位置信息在地图上可视化展示出来。地图可视化主要采用Python第三方包:folium。
地理信息可视化包folium的安装,可以通过命令pip install folium实现。
4.1数据获取
        通过Python读取附一的任务数据和附件二的会员数据,利用folium包,依次将任务和会员位置绘制在地图上,其中黑色圆点表示任务,红色圆圈点表示会员。示例代码如下:
import pandas as pd
A=pd.read_excel('附件一:已结束项目任务数据.xls')
B=pd.read_excel('附件二:会员信息数据.xlsx')
#2.导入地图可视化包
import folium as f
#利用map函数创建地图,参数依次为地图中心位置(纬度,经度)、地图缩放大小、地理坐标系编码
M=f.Map([A.iloc[0,1],A.iloc[0,2]],zoom_start=14,crs='EPSG3857')
#利用Circle函数在地图上画圆圈,参数依次为半径大小(单位:米)、圆心位置(纬度、经度)、颜色…
for t in range(len(A)):
     f.Circle(radius=50, location=[A.iloc[t,1],A.iloc[t,2]], color='black',
                  fill=True, fill_color='black').add_to(M)
for t in range(len(B)):
     f.Circle(radius=50, location=[B.iloc[t,1],B.iloc[t,2]], color='red',
                 fill=True, fill_color='red').add_to(M)
#3.保存地图,html文件,可以在浏览器打开,比如360极速浏览器  
M.save('f.html')
        执行结果如图2所示。从图可以看出,任务位置及会员位置均在同一个区域上,并且任务与会员均相对集中,即具有聚集性。同时,存在部分任务及会员远离聚集中心,这些特点对指标的定义与设计具有较好的指导意义。


4.2指标计算
        探究影响任务定价的主要因素,是本案例的主要任务。实际上,一个任务的定价不仅与其周围的任务数量、会员数量有关,还应与其发布时间有一定的关系。通过分析数据,我们发现任务的发布时间有一定的规律,即任务从6:30分开始发布第一批任务,之后每隔3分钟发布一批,最后一批的发布时间为8:00。根据这些特点,我们可以设计相关指标并进行计算,下面给予详细介绍。
 为了更好地理解指标的计算方法,便于编程计算。下面通过图示的方法介绍指标的具体计算过程。如图3所示,圆圈代表任务,三角形代表会员,分布在同一个区域上,位置均由经度和纬度确定。以某个任务为圆心,5公里范围为半径,作一个圆。




5结论
        为了对原定价方案与新方案进行比较,我们设计两个评价指标:1)任务完成增加量,即未执行任务重新定价后将被执行的增加量;2)成本增加额。第一个指标的计算,我们通过计算的12个指标+附件一的任务定价,共13个指标数据作为自变量,附件一的任务完成情况指标数据作为因变量,训练支持向量机分类模型,并对附件一中未被执行的任务重新定价后进行分类预测(预测的自变量为:未被执行任务的12个指标+神经网络预测的定价)。为了更合理地度量被执行的增加量,在支持向量机预测结果的基础上再乘以支持向量机的预测准确率。第二个指标的计算则直接利用新定价之和减去旧定价之和即可。
        如何利用地理信息可视化包folium进行绘图及数据探索的基本技能,并根据实际问题分析影响因素、设计指标及具体编程计算相关诸多细节,在此基础上构建了分析模型及具体实现。本案例对地理信息数据的可视化探索、数据处理、指标设计与计算、模型构建与实现具有一定的参考意义。

参考文献:
[1]区块链环境下基于细粒度授权隐私保护的空间众包任务分配模型,高丽萍; 程添; 高丽,小型微型计算机系统,2021-04-14   
[2]集成加权软投票的众包真值推理方法,张桦; 沈菲; 蒋世豪; 张灵均; 徐宏,清华大学学报(自然科学版),2021-04-16
[3]面向路网的空间众包群组任务匹配和调度算法,钱勤红; 刘安; 孙玉娥    小型微型计算机系统,2021-04-01
[4]众包竞赛中提交策略对接包方创新绩效的影响,毕功兵; 丁苗苗; 徐扬; 马雯琦,管理学报,2021-04-01
[5]环境信息监控中基于压缩感知的移动众包成本控制研究,高丽萍; 姚祯; 高丽; 陈庆奎,小型微型计算机系统,2021-03-31
[6]基于禁忌搜索的时空众包任务分配算法,潘庆先; 殷增轩; 董红斌; 高照龙; 童向荣,智能系统学报,2021-03-26
 依托项目:湖北省教育厅科学研究计划项目-指导性项目B2018361基于大数据挖掘的企业决策系统研究
教育部科技发展中心项目高校产学研创新基金项目-新一代信息技术创新项目2018A02016基于大数据的行业系统推荐研究

投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: