【问题标题】:Capturing user data for machine learning and recommendations为机器学习和推荐捕获用户数据
【发布时间】:2015-06-03 05:07:50
【问题描述】:

我是一个基础设施专家,如果这个问题听起来很幼稚,请原谅。我需要与开发合作伙伴一起从 PHP Web 应用程序中捕获以下数据。

  • 进入时间
  • 设备、操作系统、浏览器
  • 网络、访问来源
  • 网站上的用户操作、滚动速度
  • 用户所在的当前页面

我们的想法是将所有这些数据抽取到数据存储中,以运行机器学习算法以提供近乎实时的建议。我想了解标准 cookie 可以在多大程度上跟踪这些数据。是否有可能收集所有这些数据?

收集这些数据的正确方法是什么?

【问题讨论】:

  • 其中一些东西没有其他东西那么复杂,但我认为您可能需要使用数据库来存储大量数据以供分析。
  • @Rasclatt 是的,我很清楚存储数据部分。我们计划将此数据推送到 NoSQL 数据存储。我不清楚的是捕获这些数据的过程本身。
  • 对于进入时间,您只需记录访问您网站的带有时间戳的新 IP、设备和所有可以使用$_SERVER['HTTP_USER_AGENT'] 捕获的内容,网站上的操作将来自记录IP 在浏览每个页面时,javascript 可以捕获对项目的点击并可能滚动,当前页面将是每页 IP 记录的一部分,并带有时间戳。只是一些想法......

标签: php cookies machine-learning session-cookies recommendation-engine


【解决方案1】:

关于用户的所有信息都可以存储在database 中以供日后查看,这是跟踪用户在网站上的活动的最佳方式。

提供一些想法,

1) 进入时间 ==> 当用户刚进入网站时,有一个 TIME_STAMP 字段可以解决问题,它会自动更新 用户的输入值。

2) 用于检测操作系统 => 只需使用var_dump(PHP_OS);

3) 用于检测浏览器,设备 => $_SERVER["HTTP_USER_AGENT"]; 将 做这个把戏

4) 用户所在的当前页面 => 这可以存储在$_SESSION 变量,并且每次用户去某个地方时它都可以保持更新 其他页面并将其也存储在database

5) UserActions => 取决于您要捕获的操作以及 同样可以在数据库中更新。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2012-03-15
    • 2012-03-17
    • 1970-01-01
    • 1970-01-01
    • 2014-05-14
    • 2015-05-06
    • 1970-01-01
    • 2022-12-11
    相关资源
    最近更新 更多