|
我在通过DataSocket用http://.... 作为我的URL读取一个html文件.当我用Datasocket读html文件时,返回的字符串一切正确除了最前面的四个字符。第一个字符被重复了三次,替代了后面的三个字符。下面是一个示例:
url: http://www.ni.com/
returned string: <<<<CTYPE html PUBLIC ...
what should have been returned: <!DOCTYPE html PUBLIC ...
当我尝试着读取一个URL不是以HTM或者HTML结尾的HTML文件时,这个问题就会出现。如果URL是以HTM或者HTML结尾,那么文本将会被正确的返回。
比如:
下面的URL不能正确工作:
http://www.games.com/
http://www.w3schools.com/xsl/default.asp
http://support.microsoft.com/default.aspx?kbid=302878
但是与下面示例相似的URL能够正确工作:
http://www.games.com/index.html
在上面的例子中,http://www.games.com与http://www.games.com/index.html 是一样的。如果真是如上所述,使用完整的URL路径而不是简化的。如果完整的URL不是以htm或者html结尾,那么在URL的后面添加[html].
比如:
http://www.w3schools.com/xsl/default.asp[html]
|