在java中使用Jsoup解析富文本防止XSS攻击

不要尝试自己做黑名单过滤,除非你确认自己非常了解html标准和各种浏览器的具体实现,否则你会被各种奇怪的注入方式搞死的。

参考资料:
XSS Filter Evasion Cheat Sheet
XSS Filter Evasion Cheat Sheet 中文版
消除不受信任的HTML (来防止XSS攻击)
jsoup 处理图片时候的一个问题
JSOUP 处理一段标准的html内容,怎么样才能保留这个tag呢。

字符编码相关

javascript和html编码

 
Unicode控制字符(Unicode control characters)

 
参考资料:
JavaScript 字符串字面值
Unicode®字符百科
unicode控制字符
ScriptItemize (Windows CE 5.0)