(我对这个问题的原始回答具有误导性。它适用于随后使用 Adobe Reader 打开的 PDF 文件,但它并不总是适用于其他类型的文件。以下是更正版本。 )
很遗憾,我们无法使用 OleDb 直接检索 Access Attachment 字段中的文件内容。 Access 数据库引擎会将一些元数据添加到文件的二进制内容中,如果我们通过 OleDb 检索 .FileData,则会包含这些元数据。
为了说明,使用 Access UI 将名为“Document1.pdf”的文档保存到附件字段。该 PDF 文件的开头如下所示:
如果我们使用以下代码尝试将 PDF 文件提取到磁盘
using (OleDbCommand cmd = new OleDbCommand())
{
cmd.Connection = con;
cmd.CommandText =
"SELECT Attachments.FileData " +
"FROM AttachTest " +
"WHERE Attachments.FileName='Document1.pdf'";
using (OleDbDataReader rdr = cmd.ExecuteReader())
{
rdr.Read();
byte[] fileData = (byte[])rdr[0];
using (var fs = new FileStream(
@"C:\Users\Gord\Desktop\FromFileData.pdf",
FileMode.Create, FileAccess.Write))
{
fs.Write(fileData, 0, fileData.Length);
fs.Close();
}
}
}
然后生成的文件将在文件开头包含元数据(在这种情况下为 20 个字节)
Adobe Reader 能够打开此文件,因为它足够强大,可以忽略文件中可能出现在“%PDF-1.4”签名之前的任何“垃圾”。不幸的是,并非所有文件格式和应用程序都对文件开头的多余字节如此宽容。
唯一Official™ 从 Access 中的 Attachment 字段中提取文件的方法是使用 ACE DAO Field2 对象的 .SaveToFile 方法,如下所示:
// required COM reference: Microsoft Office 14.0 Access Database Engine Object Library
//
// using Microsoft.Office.Interop.Access.Dao; ...
var dbe = new DBEngine();
Database db = dbe.OpenDatabase(@"C:\Users\Public\Database1.accdb");
Recordset rstMain = db.OpenRecordset(
"SELECT Attachments FROM AttachTest WHERE ID=1",
RecordsetTypeEnum.dbOpenSnapshot);
Recordset2 rstAttach = rstMain.Fields["Attachments"].Value;
while ((!"Document1.pdf".Equals(rstAttach.Fields["FileName"].Value)) && (!rstAttach.EOF))
{
rstAttach.MoveNext();
}
if (rstAttach.EOF)
{
Console.WriteLine("Not found.");
}
else
{
Field2 fld = (Field2)rstAttach.Fields["FileData"];
fld.SaveToFile(@"C:\Users\Gord\Desktop\FromSaveToFile.pdf");
}
db.Close();
请注意,如果您尝试使用 Field2 对象的.Value,您仍然会在字节序列的开头获得元数据; .SaveToFile 进程将其剥离出来。