ML 分类 - 决策边界算法答案

【问题标题】：ML Classification - Decision Boundary AlgorithmML 分类 - 决策边界算法
【发布时间】：2018-08-04 04:59:00
【问题描述】：

给定机器学习中的一个分类问题，假设如下所述。

hθ(x)=g(θ'x)
z = θ'x
g(z) = 1 / (1+e^−z)

为了得到我们离散的 0 或 1 分类，我们可以将假设函数的输出翻译如下：

hθ(x)≥0.5→y=1
hθ(x)<0.5→y=0

我们的逻辑函数g的行为方式是，当它的输入大于等于0时，它的输出大于等于0.5：

g(z)≥0.5
whenz≥0

记住。

z=0,e0=1⇒g(z)=1/2
z→∞,e−∞→0⇒g(z)=1
z→−∞,e∞→∞⇒g(z)=0

所以如果我们对 g 的输入是 θTX，那么这意味着：

hθ(x)=g(θTx)≥0.5
whenθTx≥0

从这些陈述中我们现在可以说：

θ'x≥0⇒y=1
θ'x<0⇒y=0

如果决策边界是分隔 y = 0 和 y = 1 的区域的线，并且由我们的假设函数创建：

其中哪一部分与决策边界有关？或者决策边界算法从何而来？

【问题讨论】：

这是 Andrew Ng 课程中非常标准的内容。 h是假设，'表示转置，我不想写出来混淆算法。上面的算法是一个 sigmoid 函数来预测正（1）或负（0）。标题中明确说明了试图找出 ML 分类问题中决策边界的算法。
太棒了。只需添加对此表示法的引用，我相信有人可以帮助您。这听起来像是一个基本的 ML 问题，但没有必要的上下文。
我不确定您在寻找什么进一步的上下文。据说这是在 ML 分类问题的背景下。我想知道在分类上下文中计算决策边界的算法来自哪里。除了自己回答问题之外，我不确定您还想要什么。
@Lizzard 数学从来没有一个非常标准的符号或任何东西。我完全同意希思。 Andrew Ng 可能会使用这种表示法，但大多数其他人不会。用纯文本阅读这样的表达也很困难。
我明白，我已经阅读了《统计学习简介》并参加了 Andrew Ng 的入门课程，他们使用了相同的符号。也许这只是一个巧合。此外，对这些术语进行快速谷歌搜索会显示相同或相似的符号。超越该假设是 ML 中一个非常常见的术语。数学可能没有标准符号，但在 ML 的上下文中它可能有，希望如此。无论如何，我在不同的板上发布了相同的问题并得到了一些快速回复，您可以在下面看到。

【解决方案1】：

这是带有阈值的基本逻辑回归。所以你的theta' * x 只是你的权重向量乘以你的输入的向量符号。如果您将其放入专门输出 0 到 1 之间的值的逻辑函数中，您将把该值设置为 0.5。因此，如果它等于并高于此值，则将其视为正样本，否则视为负样本。

分类算法就是这么简单。训练有点复杂，它的目标是找到一个权重向量theta，它满足正确分类所有标记数据的条件......或至少尽可能多。做到这一点的方法是最小化一个成本函数，它衡量你的函数输出和预期标签之间的差异。您可以使用梯度下降来做到这一点。我猜，Andrew Ng 正在教这个。

编辑：你的分类算法是g(theta'x)>=0.5和g(theta'x)<0.5，所以是一个基本的阶跃函数。

【讨论】：

【解决方案2】：

感谢其他技术论坛上的其他发帖者。

求解 theta'*x >= 0 和 theta'*x

Theta 为您提供最适合训练集的假设。

根据 theta，您可以计算决策边界 - 它是 (X * theta) = 0 或等效地 g(X * theta) = 0.5 的点的轨迹。

【讨论】：