【发布时间】:2021-03-26 04:31:20
【问题描述】:
遇到了如何在 Python 3.7.1 for SQL 2017 (CU22) 下安装安装 NLTK python 模块的问题,但无法直接访问互联网(即离线)。
那么该怎么做呢?
【问题讨论】:
标签: python-3.x nltk sql-server-2017
遇到了如何在 Python 3.7.1 for SQL 2017 (CU22) 下安装安装 NLTK python 模块的问题,但无法直接访问互联网(即离线)。
那么该怎么做呢?
【问题讨论】:
标签: python-3.x nltk sql-server-2017
这是一个似乎可以正常工作的方法:
(1) 转到https://github.com/nltk/nltk_data/archive/refs/heads/gh-pages.zip 并下载 zip 文件 (600 MB)。
(2) 深入压缩 zip 文件,并在以下位置找到所需的包:
nltk_data-gh-pages.zip\nltk_data-gh-pages\packages\
(3) 或者创建一个目录
C:\ntlk_data ( this is a default search path for nltk )
或 -
D:\Program Files\Microsoft SQL Server\MSSQL14.instance_name>\PYTHON_SERVICES.3.7\nltk_data
(4) 对于 package/s,复制 .zip 文件及其 .XML 文件,然后将 .zip 文件解压缩,使其成为未压缩目录。
例如 punkt 模块,最终形式应如下所示:
c:\nltk_data\tokenizers\punkt.zip
c:\nltk_data\tokenizers\punkt\<and_sub_dirs_and_files>
c:\nltk_data\tokenizers\punkt.xml
(5) 运行TSQL代码确认可以看到punkt模块:
EXECUTE sp_execute_external_script
@language = N'Python',
@script =N'
import nltk
x = nltk.data.find("tokenizers/punkt")
print(x)
'
如果它可以看到磁盘上的 punkt 模块,您应该会得到类似的输出:
STDOUT message(s) from external script:
Express Edition will continue to be enforced.
C:\nltk_data\tokenizers\punkt\PY3
某人!
【讨论】: