【问题标题】:ML Classification - Decision Boundary AlgorithmML 分类 - 决策边界算法
【发布时间】:2018-08-04 04:59:00
【问题描述】:

给定机器学习中的一个分类问题,假设如下所述。

hθ(x)=g(θ'x)
z = θ'x
g(z) = 1 / (1+e^−z)

为了得到我们离散的 0 或 1 分类,我们可以将假设函数的输出翻译如下:

hθ(x)≥0.5→y=1
hθ(x)<0.5→y=0

我们的逻辑函数g的行为方式是,当它的输入大于等于0时,它的输出大于等于0.5:

g(z)≥0.5
whenz≥0

记住。

z=0,e0=1⇒g(z)=1/2
z→∞,e−∞→0⇒g(z)=1
z→−∞,e∞→∞⇒g(z)=0

所以如果我们对 g 的输入是 θTX,那么这意味着:

hθ(x)=g(θTx)≥0.5
whenθTx≥0

从这些陈述中我们现在可以说:

θ'x≥0⇒y=1
θ'x<0⇒y=0

如果决策边界是分隔 y = 0 和 y = 1 的区域的线,并且由我们的假设函数创建:

其中哪一部分与决策边界有关?或者决策边界算法从何而来?

【问题讨论】:

  • 这是 Andrew Ng 课程中非常标准的内容。 h是假设,'表示转置,我不想写出来混淆算法。上面的算法是一个 sigmoid 函数来预测正(1)或负(0)。标题中明确说明了试图找出 ML 分类问题中决策边界的算法。
  • 太棒了。只需添加对此表示法的引用,我相信有人可以帮助您。这听起来像是一个基本的 ML 问题,但没有必要的上下文。
  • 我不确定您在寻找什么进一步的上下文。据说这是在 ML 分类问题的背景下。我想知道在分类上下文中计算决策边界的算法来自哪里。除了自己回答问题之外,我不确定您还想要什么。
  • @Lizzard 数学从来没有一个非常标准的符号或任何东西。我完全同意希思。 Andrew Ng 可能会使用这种表示法,但大多数其他人不会。用纯文本阅读这样的表达也很困难。
  • 我明白,我已经阅读了《统计学习简介》并参加了 Andrew Ng 的入门课程,他们使用了相同的符号。也许这只是一个巧合。此外,对这些术语进行快速谷歌搜索会显示相同或相似的符号。超越该假设是 ML 中一个非常常见的术语。数学可能没有标准符号,但在 ML 的上下文中它可能有,希望如此。无论如何,我在不同的板上发布了相同的问题并得到了一些快速回复,您可以在下面看到。

标签: machine-learning classification


【解决方案1】:

这是带有阈值的基本逻辑回归。所以你的theta' * x 只是你的权重向量乘以你的输入的向量符号。如果您将其放入专门输出 0 到 1 之间的值的逻辑函数中,您将把该值设置为 0.5。因此,如果它等于并高于此值,则将其视为正样本,否则视为负样本。

分类算法就是这么简单。训练有点复杂,它的目标是找到一个权重向量theta,它满足正确分类所有标记数据的条件......或至少尽可能多。做到这一点的方法是最小化一个成本函数,它衡量你的函数输出和预期标签之间的差异。您可以使用梯度下降来做到这一点。我猜,Andrew Ng 正在教这个。

编辑:你的分类算法是g(theta'x)&gt;=0.5g(theta'x)&lt;0.5,所以是一个基本的阶跃函数。

【讨论】:

    【解决方案2】:

    感谢其他技术论坛上的其他发帖者。

    求解 theta'*x >= 0 和 theta'*x

    Theta 为您提供最适合训练集的假设。

    根据 theta,您可以计算决策边界 - 它是 (X * theta) = 0 或等效地 g(X * theta) = 0.5 的点的轨迹。

    【讨论】:

      猜你喜欢
      • 2017-03-31
      • 2017-09-20
      • 2017-04-12
      • 2014-03-01
      • 2018-12-12
      • 2018-11-08
      • 2013-10-04
      • 2014-02-26
      • 1970-01-01
      相关资源
      最近更新 更多