• 联系我们
  • 上海平正评估有限公司
  • 联系电话: 021-58361812
  • 021-58361819
  • 邮 箱: pzpg@163.com
  • 联系地址: 上海市浦东新区浦东大道2000号阳光世界大厦24C
    备案号:沪ICP备09064586号-2
    首页 > 新闻动态
  • 新闻动态
    基于用 关注的房地 特征价格模型构建研究 ———以合肥市例

    [来源][pzpg001][发表时间] 2023/03/15阅读次数:1004次
     

     导读:特征价格模型是房地 研究中常用的 典模型,其特征指 往往基于研究者 往  及偏好来 取,  土地评估,资产评估,商标评估,软件评估房者情感偏好考 不足。基于房地 网 平台上丰富的在 用   ,挖掘其所 含的 房者情感偏好,建立体 用 关注的房地 特征价格模型,并以合肥市 例,采集148 楼 数据 行  研究。 评估公司,评估机构,固定资产评估,价格评估果表明,“区位”“ 型”“装修”“生活配套”“物  量”“ 化 境”“交通”“学区”  房者 著偏好的房地 特征指 ,而依据 些特征指 构建的房地 特征价格模型能 合理地 估房地 特征属性的 含价格,具有良好的 合度和 高的解 能力。关  :在   ;商品特征;特征价格模型

    特征价格模型(                                               )自    成,价格由所有特征属性带给的效用共同决

             hedonicpricemodel HPM                                                                         

                                                                      定。由于各个特征属性的数量及 合方式不同,房

              生以来就被广泛用于房地 价格 估1-3  。房地        

              是一种最典型的异 性商品,不同住宅在建筑、   地 价格就会 生差异。通  位特征属性的

              里、区位等属性方面都可能存在著区。因     效用 化分析来 估 种特征属性的 含价格,

             此,  特征 量的合理与否是正确构建        HPM             Hedonic价格       [4]。         

                                                                                            因此   哪些特征属性 入

             关 。就 有文献 察来看, 些特征 量往往基        特征价格模型中就非常重要, 漏 量或 量 

             于研究者的 往  及偏好 取,不同研究 取的      将 致参数估 不准确[9]。

             特征 量各不相同,其构建的模型方程也有差异。                相关 域的国内外文献 

             地,不同方程所表合度也会有所                                                             

                                                                                   早在20世 80年代就有学者指出 尽管Rosen的

             [ ]                                                                 含市 理构建了hedonic实证研究的基本框

             差异4-6 。                                                                    

                                                                              架,但并未  量及函数形式的  提供明确的指

             近年来 随着子商 的迅猛 展 在线评论 

             作 一种新型情 源,成 商家挖掘用 需求、提                                                     

                            10-13 。                                   

                                                                                                    在 多  研究中 Hedonic模型中

             [ ]                                                  也往往是研究者凭借主 判断确定,并没有

             升用  意度的重要数据  7-8        。 于 房者而       

                                                                                 做 致深入的分析。以国内研究道交通房地

             言 他 在 下 地看房的前后也会去房地 网       

                                                                                 价格影响 域的文献 例,大部分文献 住宅的

             平台搜索 所看房源的 价 房源周  施的 价      

                                                     基于  构特征,即面、楼、房等因素考虑较为

             等相关在    从而做出相 的 房决策                         

             此,本文  利用房地 网 平台中的在   全,但在教育 源和生活配套的一些重要特征 量

             掘出 含的 房者情感 向 提取 房者在形成          上却千差万          

                                                                                                                    14-20    

                                                                                 象,即属于  中小学划片分配的住宅价格 著高

              决策  著偏好的房源特征 在此基 上 取特      

                                                                                 于非划片区域。教育 源的  与否极有可能影

             征 量来构建特征价格模型 从而 房地 行 的    

             生 决策和 房者的消 行 提供参考。                                            响 道交通 沿 住宅价格的溢价水平。与此同

    1 文献 述                                                               多研究 了减少 漏来的偏差,几乎

             根据Lancaster的消 者效用理 和Rosen的        所有的HPM 研究都会在模型中 入大量的特征

              含市 理,房地多不同的特征属性      量,而使用大量的特征行估计时,会生高

                                                                                                                                      

     

    收稿日期:2022-06-14

    作者 介: 沁娜(1978—),女,山西沁水人,合肥工 大学管理学院,副教授,博士, 士研究生  ,研究方向  源 境  与政策;李航(1997—),男(苗族),湖南湘西人,合肥工 大学管理学院, 士研究生,研究方向  源 境 

     

     

    221

     

                              科技和                                                                                                                                                                                                       第22卷       第11期              

                                                                                                                                                                                                                                                                                                                                        

             度的共 性   12-21 。                                                                                                                                                                                                                                                                       

                                                由此可  有必要  Hedonic模 构建体 用 关注的房地 特征价格模型方法 并

             型的特征 量  展开研究。                                                                                                       以合肥房地 市  研究 象 行  研究,分析

                               得关注的是,近年来,随着子商的迅猛         每个特征属性 住宅价格的影响。                                                                           

              展,在 用   作 一种新型情 源,成  2 研究方法                                                                                                                                           

             家挖掘用需求、提升用户满意度的重要数据  在 用   代表着消 者的 点、 度和情

             。特 是机器学 、自然 言 理理 和方法的        感,利用 品特征提取工具可以从中挖掘消 者关

             日益成熟,加速 放了海量在   数据的价      注和偏好的 品特征。 不 能 用于 品推

             从 有文献梳理来看,目前学者 主要通 在        荐, 能 帮助商家  并改进产品的不足,从而

              数据挖掘开展 品特征提取和用 情感分析,     品的 争力。当前 品特征提取方法主要

             而 行用 需求分 和 品   化的相关研究, 有基于关联规则词频 的提取方法                

                              35-37    

                                                                                                                                                                                                                                                                                                                                       

                                                                                                                                                                                                                                                                                                          

             域主要集中在                 22-23              旅游  24-25                                                                                                                                                                                 

                                                                                                                                                              基于句法依存的提取方法    38-40              基于改的LDA

                                                                                                                                                                                                            

                                                                                                                                                                                   [41-43]                                                                                         [44-46]                  

                   26-27 、          28-29                                                                                                                        提取方法                                                                                                              等。

                                       酒店           等 研究方法也从逐步从传统统                 ,基于机器学的提取方法                                        

              方法 展到了机器学 。周立欣等从京         本文参考借 了李 卿等提出的基于同义词林与

             平台收集在   构建特征情感的二分加 网 ,                                                                                                       [46]                                            

                       向量的 品特征提取及  构建方法                                                             

                                                                                                                                                                                                                   首先采

                                                                                                                                                                         用人工 注提取和同  林 展形成种子  ,随

             并 行仿真   按照用   品特征的重 程度 

               品特征 行了排序[30]。Zhou等提出了奇异   后使用Word2vec 和大 模  数据 行模型

                                                                                                                                                                                 ,完成  相 度 算与属性并,形成 品特

             分解的    相似度的方法 通  用于在

                    商品的 度, 企 改 商品性                                                                                                                                                                 

                      征 典47-49 。具体流程如 1所示。                                                                            

             能提供依据[31]。 丹萍等基于        Word2vec  和滑 窗                                                                         采集房地

                                                                                                                                                  行数据采集与预处                      

                                                                                                                                                                        平台上的 本楼 在线 数据。之后利用

             口技 分析iPhone手机在     合感性工学理     

              更有效地捕捉用 的感性需求[32]。刑云菲等以         Python       中的    行分 , 合停用  典,

                                                                                                                                                                                                    jieba                                                                                                                                             

    TripAdvisor网站 例,采集北京、上海、深圳和广 除与房地 特征无关的  ,并按   行降序排

             州4个城市的酒店用 在   内容构建主题图                                                                                                                                                                 

                      列 去除低  和高 非特征 得到可用于后

             ,并分析  以及 体的社会网 特征,发现      研究的数据集。                                                                                                                                                

             同地区酒店的用 需求存在差异化     [33]。                                          随机抽取本楼中的部

                                       2构建种子词库            

             抽取知乎直播用 的消极  ,以 粒度 点的方        数据,采用人工方式 行 注、 并与分 ,

             法建立特征体系,揭示了知乎直播存在的缺陷和不        利用 些  中所提到的 品特征,建立特征种子

             足[34]。 房地  域而言,在房地 网 平台上的   词库。并以提取出的种子  基准,通 哈工大同

                中, 价内容丰富,包括房源建筑 构、小       林 种子   行 展。                                                                                                    

                                                                                                                                                                                                                将完成数据清洗预处

             区 境 周  施及入住感受等 能 真 地反映           行 向量训练           

              房者 房源的 期期望和实际入住体 。基于        后的 本楼 在 用   文本分后作为训练

             此,本文提出通 挖掘房地 网 平台上在            料, 定合适的蚕食,借助Word2vec中的Skip-

             所 含的 房者情感偏好,提取房地 特征属性来   gram模型或CBOW 两个模型 行 向量  ,得

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    房地 特征属性提取流程

     

     

    222

     

     沁娜等:基于用 关注的房地 特征价格模型构建研究

     

     

     

    到候 特征 的 向量。

     

    4)形成 品特征  。模型  完成之后,算候 特征  和种子  中各个  之 的 相似度及相关度,并将相似度大的候 特征 加入种子  中,形成最 的 品特征 

     

    5)  品特征词库进行分了更清晰明了地展示 品特征属性,需要将最  取的 品特征  按照其描述方面的不同 行分 ,以方便后期的  研究。目前分 的方法主要有人工分 、聚 算法等。

     

    3 合肥市房地 特征价格模型构建

     

    3.1 数据采集与 

     

    2021年5月,通 八爪  件在合肥市房天下网站上 行数据采集。在房天下在售或待开的新楼 中,按照分 抽 的方法,共爬取38个新楼 的在   9266条(表1)。之后将每个楼 的  数据 行  , 行数据  理工作。

     

     

             表1   分 抽取合肥市楼 

                              

        楼 数 抽取数        楼 名称

                                               

         27                           ·

                                       万科森林公园 碧桂园  代 城

    瑶海  40                    安建·翰林天筑、新力 园、 上街

                                       球中心       

                                               

                                               

    蜀山  30                          

                                       金隅南七里   桃源里

    包河  43                    恒大水晶国广、信达·天御、

                                       湖·阳光里   

                                               

                                               

                              蔚 商 港   

    高新  29                           ·

                                       太平洋森活广  祥源 金港湾

         12                    水安盛世桃源      

    新站  31                    隆昊昊天园、圣 梦溪小 、禹洲中

                                       央城 

                                               

                                      

     湖新 37                    合肥融 文旅城/梧桐街、文一·豪

                                       金地、国 中心     

                                               

                                      

    肥西  53                    万瑞林山翠 、西南  城、光明·

                                        公 、 南城·紫 名都

                                      

                                      

        66                    合肥孔雀城、盛世新城、星光国 广

                                       方明珠嘉苑、安建  花园

                                      

                                      

         58                    新慧御湖城、恒泰阿奎利 ·悦璟府、

                                       御景嘉苑、元一·后九

                                      

                                               

         23                          

                                       新力湖畔樾山  江美的城

    巢湖  36                    天巢广 、 源聚 湾、深 半 御

                                       泉庄 

                                               

                                               

     

     

    3.3 模型 

     

    采用Word2vec工具中的Skip-gram 模型 行模型训练。首先使用inport指令用gensim 、Word2vec模型和os 具将  理后的名 及名 短 集合  成 向量。

     

      完成后, 算候   和种子  中各个  之 的余弦相似度,并将相似度大的候  加入种子  中,形成 品特征 典。完成后  的相似度 算后,  有很大一部分与种子 相似度高的  并不能代表商品的属性或者特征,需要将其 理与剔除。如“交通” 个属性,与其相似度高的如“成熟、、性价比、有点”, 然 于 些  ,需要 理与剔除,最形成房地产产品特征词库(表2)。

     

     

     

    3.4 合肥房地 特征  与分

     

    由于最后得到的品特征词库所含的单词数量已  小,本文主要采用了人工分 的方法 行 品特征分 。最   出“区位”“ 型”“装修”

     

    “配套 施”“物  量”“ 化 境”“交通”“学区”共8个代表消 者 著偏好的房地 特征属性,表2。

     

     

    表2 房地  品特征 

     

    序号  品特征     房地 特征

                     

           地段位置市中心区内一  一 内        区位

               三房阳台主卧室套型楼 距小 型       

           起居室窗   房主客主卧空 感朝南  

             墅游泳池    大 型厨房公

                     

           格美  大气  尚通  空 感精装 装修

             设计       

                     

                     

             配套周    公司超市便利医院公园        

           行万达广   物市  商圈卖场     配套 施

             院逛街酒店花园商 广   物中心     

                     

           物 管理    境干  清爽空气           

                      

                     

                     

             野花草 宜人 景 园林   化 境

                 

                     

                     

           出行便利公交交通公交  公交 路公交       交通

             站地 口     

                     

                     

           上学学校中学学区小学教育幼儿园 就      学区

             近入学       

                     

                     

     

     

    3.2  种子  构建                  研究                

             从清洗后的数据集中,随机抽取110条关于恒      4.1  特征 量的 取              

    大水晶国广的在线评论数据,人工                       依据前文  出“区位”“ 型”“装修”“生活配

    注、 并与分,并且按词频排序去除低 和高         ”“     ”“     ”“     ”“ 

                                                 化 境        交通  学区 共8个代

     非特征 ,建立特征种子  。并以提取出的种      表消 者 著偏好的楼 特征来 行房地特征

      基准,通 哈工大同  林 种子       价格模型构建。            

                                     区位特征表征的是一个地区经济

                                       1区位        

                                                                 223

     

                      科技和                                                                                                                                                                                                                                                                                               第22卷                第11期              

             社会 展水平。本文采用楼 距本 区政府的直       本文主要   化率来表征。                                                                                                                        

              距离来量化区位因素                                                                                                                                    学区所占有的优质教育源具有明

                                                                                                                                              学区          

                                                                                                                                                                                                        的溢价效                                                                                                                                                                           

                                          型的表征种  多 住宅的面 和                                  本文主要采用以小区 中心 半径

             功能 数都是从不同的角度 房屋居住的舒适度                                                                                                                                                                                    

                      1km的范 内是否有幼儿园 小学 中学 每

              行的 价                                                                                                                                                                                                                                                                                                                                                                  

                              由于一个楼 往往 有多种 型 本      1分 共3分                                                                                                                                                                                              

             文 取楼 的最大 型和最小 型分  行量化                       考 到合肥市第一条地铁线路已

                                              交通          

                                                                                                                                                                                                                                                                                                                                                                                                              

                             装修           主要是指房屋的装修程度 通常分    于2016年开始运  本文主要采用楼 500m范

                                                                                                                         由于本次研究      内公交 路条数和楼 到最近地 站的直线距离

             毛坯  装 精装和豪装4个等                   

             象均 新楼 ,装修基本 毛坯房,故将“装修”特    来量化交通的便利性。                                                                                                                                      

             征 量剔除。                                                                                                                                                               4.2 数据采集和量化                                                                                                                                       

                                                                       主要考察小区生活便利程度            通 八爪 爬虫件在房天下平台合肥市

                             生活配套                                       

                                                                                                                                                               的范 2021年5月在售新楼 数据 行收集               由于本次

             本文主要采用以小区 中心 半径 1km                                                 

                                                                                                                                                                                                                                                                                                                                                                                                                 

             内是否有超市 餐 医院 项计1分   研究 象均 新楼 楼 装修基本 毛坯房 故

    4分                                                                                                                                                                                                                                                                                                                                      ”“     ”“             

                                                                                                                                                                                                             将 装修 特征 量剔除            针对 区位                                

                                                                                                                                                                                      活配套        ”“                                                          ”“                                ”“                                         ”“             

                                                        一般来    越高 意味着               业质                      绿                               交通  学区          

                                                                                                                                                                      本文主      7个房地 特征 取了9个特征 量             了保 数

               量 小区的 境和管理也会越完善                                                            

                 来量化物  量。                                                                                                据的真 性和准确性,将重复 本剔除并 极端

                                                              绿化率越高意味着建筑密度                                                                                                                                                                                                                 

                             化 境                                  行了 尾 理 最 共收集148个楼 交易数据               

                                                                                                                                                                                                                                                                                                                                                                                                                                  

             越低 小区内 化等自然景  境条件就会更好                所有 量的 明与描述性   表3                                                                              

                                                                                                                                                                  表3   量的描述性                                                                                                                                                                                                            

                                                                                                                                                                                                                                                                                                                              

                                                                                                                           量化指                                                                                                            准差         最小                                     最大         

                                                                                                                                                                                                                                                                                                                                                                                                                                                        

             住宅价格                                                                                                                                                                                                           13635.00                 5064.00  6500.00                   26752.00                 

                                       楼 挂牌均价 元                                                                                                                                                                                                           

             住宅价格 数                 楼 挂牌均价自然 数                                                                                                                                9.46                          0.36                                   8.78                                   10.19                 

             区位                                                                                                                                                                                                                          13.48                        16.63                                 1.50                                   58.80              

                                                小区到本 区政府的直 距离    km                                                                                                                                                                                                                     

             最大 型                                                                                                                                                                                                                      146.61                      67.98                        53.00                                 423.00            

                                       楼 最大 型的面 /m                                                                                                                                                                                                                              

             最小 型                                                                                                                                                                                                                               91.31                        24.82                        38.00                                217.00            

                                       楼 最小 型的面 /m                                                                                                                                                                                                                                      

             生活配套                                                                                                                                                                                             3.03                          1.02                                                                                                    

                                       小区1km之内是否有超市 餐  医院  行 每  1分 共4分                                                                                                                                                                 

                                                                                                                                                                                                                                          1.91                          0.70                                   0.60                                   4.30                

                                                住宅小区物 管理 /(元/月/m                                                                                                                                                                                                                    

              化率                           住宅小区   化率                                                                                                                                              0.39                          0.04                                   0.20                                   0.43              

             学区                                                                                                                                                                                                            2.21                          0.91                                                                                                   

                                                小区1km之内是否有幼儿园 小学 中学 每  1分 共3分                                                                                                                                                                           

             公交 路                        小区500m之内公交 路条数                                                                                                                    2.26                          1.85                                                                                                      

             地 距离                                                                                                                                                                                                                     11.16                        16.79                                 0.10                                   52.00              

                                       小区到最近地 站的直 距离    km                                                                                                                                                                                                                     

    4.3    果分析                                                                                                                                                                                                                                                                                                             

                                                                                                                                       以看出 模型不存在异方差                            因此 模型基

                      特征价格模型常用的函数形式有 性、半 数        本 足了同方差性和独立性假 ,具有良好的 合

             和全 数形式。 于模型函数形式的选择并没有      度和 高的解 能力。                                                                                                                                         

              一的 准                                                                                                                                                                                                                                                                                                                                                                                           

                              基于国内外已有文献研究 半 数形   从回  果看出 在 著性10%的水平下       9个

                                                                                                                                                                                                                                                                                                                                                                                       ”“                      

             式在 量 位差异性 量化解 量的影响 异方     量中有8个 入了模型 分 是 区位           最大

                                                                                                                                                                                                                                                                                                                                                                                                                                            

             差最小化等方面 于 性形式和全 数形式   50-51            型”“最小 型”“生活配套”“物  ”“ 化率”“学

                                                        

                                                                                                                                                                                                             ”“                                ”。“                                                                                                                                             

             因此本文主要采用Stata 件 行  研究          区 地 距离                                    公交 路 的 著性 0.3398

                                                                                                                                                                                                                    未通  著性                                                                                                                                               

             数形式的回  果 表4                                                                                                                                        究其原因 公交 路越多的地

                      模型的整后的                                                                                                         方,噪声 染可能越 重,在上下班高峰期也会造

                                                                                                    R =0.5787     F-statics=                                                                                                                                                                                                                                           

                                                                                                         多重共 性        成交通堵塞        同 公交出行所花 的时间具有

    21.0618  整体的 合度 好                                     

                                                                                                                                                                                                                                                                                                                                                                                                                                  

              果表明 所有 量的方差膨 因子VIF最大          高的不确定性 与地 私家 和共享  等存在

                                                                                                                                                                                                                                                      [52]                                                                                                                                                            

                                                                                                                                                                                                                        的替代性                   , “                                                                                                                             

    1.87  明解释变量之 相 独立 不存在                                      故 公交 路  住宅价格的影响

             多重共 性  。从White  和BP   果可     被弱化。因此基于用 关注的合肥市新楼特征

     

     

    224

     

     沁娜等:基于用 关注的房地 特征价格模型构建研究

     

     

     

    价格模型

     

    ln(住宅价格)=8.4952-0.0018(区位)+0.0011(最大 型)+0.0033(最小 型)+0.0201(生活配套)+0.1189(物  )+0.7197( 化率)+0.0475(学区)-

     

    0.0099(地 距离)。

     

    表4 模型回 

     

    被解  量:   系数                  VIF

    住宅价格 数                                          

                                               

                                                                         

    区位                             ***        -3.8413          0.0002    1.09

                                       -0.0018                          

    最大 型                                0.0011    2.9862             0.0033    1.54

                                       ***                                 

                                                                         

    最小 型                                0.0033    2.6026             0.0103    1.87

                                       **                            

                                                                         

    生活配套                               0.0201    1.8892             0.0610    1.53

                                                                      

                                                                         

                                  0.1189    3.4653             0.0007    1.45

                                       ***                                 

                                                                         

     化率                           0.7197    4.0067             0.0001    1.32

                                       ***                                 

                                                                         

    学区                                   1.8513             0.0663    1.41

                                       0.0475                             

    公交 路                                -0.0123 -0.9578          0.3398    1.41

    地 距离                                -0.0099 -6.7662                 1.57

                                       ***                                 

                                                                         

    常数                            8.4952    39.8731                 

                                       ***                                 

                                                                         

     本量                                    148          

                                              0.5787   

     整R                                            

    F-static                                       21.0618 

                                             0.3799   

                                   

                                 0.7859   

    BP检验                                             

    注:*、**、***分 表示在10%、5%、1%的水平下 著。

     

    在保持其他特征不 的条件下,最大 型和最小 型面 的回 系数均 正数,楼 住宅价格会随着住宅面的增加而增加。楼业费绿化率、生活配套和学区的回 系数也正,明小区物  量越高, 化 境越好,生活配套和教育配套越完善,楼 住宅价格也越高;区位和地距离的回 系数 著  表明楼 距离区政府和地 站越近,楼 住宅价格越高。从  学和常 的角度来看 些特征 量的回 系数符号均与 期相符, 明舒适的居住 境和便利的配套 施会更加受到 房者的青 , 住宅价格也有 著的增 作用。

     

     

     

       与展望

     

      的特征价格模型中,特征 量的  往往是参照其他学者的研究  和主   直接 定,缺少   范的   程,容易造成重要特征缺失或多重共 性等  ,从而影响模型的精确度,也不能反映 房者的真 偏好。本文利用基于同 林与 向量的 品特征提取及  构建方法,通 挖掘房地 网 平台在 用   中 含的房者情感 向,构建体 用 关注的房地 特征价格模型,并以合肥市148 新楼 数据  本 行

     

     

      研究。 果 示, 模型能 合理地避免自 量的多重共 性,也能 合理 估房地 特征属性的 含价格,具有良好的度和高的解能力。伴随着新消  的延展以及新一代消 群体的崛起,可以  ,通 网 在 用 评论来表达自己的意 和 点将成 一种流行的方式。深度挖掘 些信息不 能  消 者房决策和开 商建  足广大 房者需求的小区提供依据,也可以 政府 行公共 源 化配置提供决策参考。

     

     

     

    参考文献

     

    []                                                                                                                    

           ROSENS.Hedonicpricesandimlicitmarketsp         product

                                                                                   []                                                

    differentiationinpurecompetitionJ.TheJournalofPo-

                                                       , ():                                                            

    liticalEconomy1974821      34-55.                                              

    []                                                                                                                            

           GOODMANCA.Hedonicpricespriceindicesandhous-

                                       []                                                                 ,():

    ingmarketJ.JournalofUrbanEconomics197854  

    471-487.                                                                                              

    []                                                                                                                    

                     温海珍.房地 特征价格模型的理  展及其

                      用[]  外国  与管理,    ():                                             

                      J.                               20045      42-4449.                        

    []                                                                                                          

                   温海珍  生 .住宅的特征与特征的价格     基于特征价

                                                []                                                         ),     ( ):

                      格模型的分析J .浙江大学学 工学版             200410   

                                                                                                                           

    101-105 112.                                                                                      

    []                                                                                                                    

                   文秀  徐健.基于用   的商品特征提取及特征价格

                      研究[]数据分析与知          ,():                  

                      J.                               201937    42-51.  

    []                                                                                      来自评论

                   修箭 李旭升   萍. 房者关心什么                 

                                                                 [ / ]                                                 

                      本和房地 市 的 据 EBOL .北京 中国科技 文在

                      线                                     ://                                                         

                      2019-05-13.http  www.paper.edu.cnreleasepa-

                                                                                                                                 

    percontent201905-115.                                                              

    []                                                                                                                  

                   夏火松  培 熊淦.基于特征提取改 的在 评论有效

                      性分 模型[]情 学 ,     , ():                                          

                                                J.             2015345  493-500.      

    []                                                                                                                  

                   邢云菲 曹高  陶然.网 用 在   的主题图谱

                                                                                          []             

                      建及可 化研究 以酒店用户评论为 J .情科学    

                      , ():                                                                           

    2021399  101-109 116.                                                                     

    []                                                                                                            []    

                   王德 黄万枢.Hedonic住宅价格法及其 用J .城市

                      划,   ():                                                                                 

                      20053      62-71.                                                                                 

    [ ]             BUTLERRV.Thespecificationofhedonicindexesfor

    10            

                                                []                                       , ():       

                      urbanhousingJ.LandEconomy1982581 96-108     

    [ ]                                                                                                                  

    11             SCOTTATHOMASD.ABayesianapproachtoassess-

                                                                                            []             

                      ingtherobustnessofhedonicpropertyJ.Journalof

                                                                        ,():                                            

                      AppliedEconometrics198721 27-45.                       

    [ ]                                                                                                                

    12                李 昭 吴 .Hedonic住房价格模型的 

                      实证检验     []                                                                       ( ):

                              J.系工程理 20103011      

     

    1921-1930.

     

    [13] CHRISG,DANIELG,ULRIKEG,etal.Pricinginthesharingeconomy:ahedonicpricingmodelappliedtoAirbnblistings[J].JournalofTravel&TourismMar-keting,2018,35:46-56

     

    [14]  冬玲.杭州城市公共交通 住宅价格影响分析[D].杭

     

    州:浙江大学,2019.

     

    [15] 黄  .城市 道交通 周 房地 价格的影响:以

     

    225

     

    科技和      第22卷 第11期

     

     

     

    州地 1号  例[J].洛阳 范学院学 ,2017,36(2):

     

    75-81.

     

    [16]  高禄,  光.成都市城市快速 道交通 住房价格影响[C]//20153rdInternationalConferenceonSocialScienceandHumanity(ICSSH2015),2015:123-128.

     

    [17] WEIJF,WEIYG,JIANGK.Studyontheaffectingfac-torsofhousingpricesalongrailtransitbasedonhedonicpricemodel:casestudyofBeijingSubwayLine5[J].AppliedMechanicsandMaterials,2014,507:642-645.

    [18] 梁青槐,孔令洋, 文斌.城市 道交通 沿 住宅价 影响定量 算例研究[J].土木工程学,2007(4):98-103.

     

    [19]  荣宝, 美招.城市 道交通 沿 房价影响的定量分析:以广州地 五号线为例[J].当代旅游(学版),2010(2):25-28.

     

    [20] 于富 .城市 道交通 沿 房地 价 影响的 

     

    [D].北京:北京交通大学,2012.

     

    [21] HENRYMK,PATRICKPK.AhedonicpricemodelforprivatepropertiesinHongKong[J].TheJournalofRealEstateFinanceandEconomics,1995,10(1):37-48.

    [22] 蒋忠珍,何景明.基于在   的高端 香型白酒消特征分析:以 天茅台酒在京 上的在    例[J].中国 造,2021,40(10):235-238.

     

    [23] 祝琳琳,李 ,李世 ,等.面向 子商网站的在线评 信息 量感知机理研究[J/OL].图书工作:1-9[20220125].htts://doi.or/10.13266/.issn.0252

    --                       

     

    3116.2021.06.004.

     

    [24] 梁 ,田佳佳,刁建超,等.基于三 度理的游客在线 分情感异性及影响因素研究[J/OL].南开管理评论:1-29[2022-01-25].http://kns.cnki.net/kcms/de-tail/12.1288.F.20210810.1007.002.html.

     

    [25] 甘子琴.基于在   挖掘的旅游 子商 服  量研究:以“携程旅行网” 例[J].中国集体  ,2021(13):71-73.

     

    [26]  永 ,王哲平.网 口碑 票房表 的影响研究:基于人工神 网 的 影票房  [J]. 影文学,2021(21):3-14.

     

    [27] 刘磊,柳旭 .外国 众 中国 影在   的文本分析:基于IMDb网站的 本  [J].当代 影,2020(3):144-149.

     

    [28] 蒋乾,刘莎,唐宏,等.短租民宿在  论语义及感知 度研究:基于途家网和Airbnb的文本挖掘[J]. 源开 与市 ,2022,38(2):239-248.

     

    [29] 史达,王乐乐,衣博文.在线评论有用性的深度数据挖掘:基于TripAdvisor的酒店  数据[J].南开管理评论,2020,23(5):64-75.

     

    [30] 周立欣,林杰.基于 NodeRank算法的 品特征提取研究

     

    [J].数据分析与知   ,2018,2(4):90-98.

     

    [31] ZHOUS,QIAOZ,DUQ,etal.Measuringcustomeragilityfromonlinereviewsusingbigdatatextanalytics[J].JournalofManagementInformationSystem,2018,35(2):510-539.

     

     

    [32]  丹萍,靳健,耿 ,等.感性工学 角下的用需求挖

     

    掘研究[J].情 学 ,2020,39(3):308-316.

    [33] 邢云菲,曹高 ,陶然.网 用 在   的主   构建及可 化研究:以酒店用户评论为例[J].情科学,2021(9):101-109.

     

    [34] 严炜炜  瑞,黄 .干 足否:知 直播品特征提

     

    取与  挖掘[J].  情 知 ,2021,38(4):11.

     

    [35] HUM,LIUB.Miningandsummarizingcustomerre-views[C]//ProceedingsoftheTenthACMSIGKDDIn-ternationalConferenceonKnowledgeDiscoveryandDataMining,2004:168-177.

     

    [36] BLAIR-GOLDENSOHNS,HANNANK,MCDONALDR,etal.Buildingasentimentsummarizerforlocalservicereviews[C]//ProceedingsoftheWWW2008Workshop:NLPintheInformationExplosionEra(NLPIX2008),2008:200-207.

    [37] 阮光册,夏磊.基于关   的文本主 深度挖掘

     

    研究[J]. 代  情 技 ,2016(12):50-56.

     

    [38] WUY,ZHANGQ,HUANGXJ,etal.Phrasedepend-encyparsingforopinionmining[C]//Proceedingsofthe2009ConferenceonEmpiricalMementalJointApproachtoWordSegmentation,POSTagging,andDependencyParsinginChinese,Proceedingsofthe50thAnnualMeetingoftheAssociationforComputationalLinguistics(Volume1:LongPapers),2012:1045-1053.

    [39]  静,吴 ,魏从悦,等.基于句法依存卷

     

    句子相似度 算[J].重 大学学 ,2020,43(9):41-53.[40] TITOVI,MCDONALDR.Modelingonlinereviewswithmulti-graintopicmodels[C]//Proceedingsofthe17thInternationalConferenceonWorldWideWeb,2008:111-

    120.

     

    [41] BOUAZIZA,DARTIGUES-PALLEZC,DACOSTAPC,etal.Shorttextclassificationusingsemanticrandomforest[C]//InternationalConferenceonDataWarehou-singandKnowledgeDiscovery.Springer,Cham,2014:288-299.

     

    [42] 彭云.提取商品特征和情感 的   束 LDA模型研

     

    究[D].南昌:江西  大学,2016.

     

    [43] 彭云,万常 ,江 蛟,等.基于   束LDA的商品特

     

    征和情感 提取[J]. 件学 ,2017,28(3):676-693.[44] 彭云,万常 ,江 蛟,等.基于   束LDA的商品特征和情感 提取[J]. 件学 ,2017,28(3):676-693.

     

    [45] MIKOLOVT,SUTSKEVERI,CHENK,etal.Distribu-

    tedrepresentationsofwordsandphrasesandtheircom-positionality[C]//AdvancesinNeuralInformationPro-cessingSystems,2013:3111-3119.

     

    [46] 李 卿,王  .基于大 模  数据的 品特征典构建方法研究[J].数据分析与知识发现,2018,2(1):41-50.

     

    [47] 黄仁,张卫.基于 word2vec的互 网商品  情感 向

     

    研究[J]. 算机科学,2016(S1):387.389.

     

    [48]  可嘉, 晶晶,靳健,等.基于  和情景语义

     

     

    226

     

     沁娜等:基于用 关注的房地 特征价格模型构建研究

     

     

             []            ),            [ ]                        

             特征提取方法J .广西大学学  自然科学版        202045    50      饶烨 胡志丁 等.北京都市区土地价格梯度估算

             ():                                       与解析[]自然 源学 ,   , ():

             6 1413-1422.                                                   J.     2013285 11.

    [ ]                                   [ ]                         

    49    SIRMANSGSMACPHERSONDAZIETZEN.The     51    董藩 丁宏  安平.通勤成本与 道交通周 房价的空

                      []                                分布:以北京地 五号 周 住宅市  例的  分析

             compositionofhedonicpricingmodelsJ.JournalofRe-                                      

                    , ():                                   []北京 范大学学 (社会科学版),  ():

             alEstateLiterature2005131 3-34.                             J.                      20094 137-143.

     

    ResearchonHousingHedonicPriceModelBasedonUserConcerns:

    TakingHefeiCityasanexample

    1,2,        

    ZHAOQinna        LIHang

     

    (1.SchoolofManagement,HefeiUniversityofTechnology,Hefei230009,China;

    2.ResearchCenterofIndustrialTransferandInnovationDevelopment,HefeiUniversityofTechnology,Hefei230009,China)

     

    Abstract:HedonicPriceModelisaclassicmodel,whichcommonlyusedinrealestateresearch.Itscharacteristicindexesareoftenselected

    basedonresearchers’pastexperienceandpreference,whiletheemotionalpreferenceofhomebuyersisnotconsideredenough.Basedonthe

                                                                                                                   

    abundantonlineusercommentsontherealestatenetworkplatformtheimplicitemotionalpreferenceofhomebuyersisexploredandthechar-

                                                                                                                 

    acteristicpricemodelofrealestatethatreflectsusersconcernsisestablished.TakingHefeiCityasanexample148groupsofrealestatedata

    arecolectedforemiricalresearch.Theresultsshowthatp          ”“     ”“     ”“     ”“    

             location      housetype  decoration supportingfacilities      proertpyquality

           ”“     ”  “  ”                                          ’                                

    greenenvironment trafficandschooldistrictarethecharacteristicsofrealestatebuersy  sinificantgpreferences.Andthehedonicprice

     

    modelconsistedofthesecharacteristicscanreasonablyevaluatetheimpliedpriceofproductcharacteristicsandhasgoodgoodnessoffitandhighexplanatoryability.

                 

     

     

    Keywordsonlinereviewscommoditycharacteristicshedonicpricemodel