python 转换 Javascript %u 字符串为python unicode的代码

yipeiwu_com6年前Python基础

web采集的数据为 %u6B63%u5F0F%u4EBA%u5458,需要读取并转换为python对象,想了下不调用Javascript去eval,只能自己翻译了。

核心代码:

import re
import codecs
pattern = re.compile('%u[0-9A-Z]{4}')

n = codecs.open('d:\\new.txt', 'w', 'utf-8') 
with open('d:\\p', 'r') as f:
 for l in f:
  for i in pattern.findall(l):
   l = l.replace(i, unichr(int(i[2:], 16)))
   n.write(l)

n.close()

相关文章

有关wxpython pyqt内存占用问题分析

一直觉得wxpython占用内存比较多,在工作中写的一些小程序应用,一对比其它的小程序,发现内存相差确实有点大。 测试了下QT框架 复制代码 代码如下:import sys,timefr...

Python Django 前后端分离 API的方法

步骤 根据之前的文章已经搭建好 Django的目录 开始流程 运行 manage.py 文件 # 创建一个app startapp ulb_manager settings.py...

python绘制漏斗图步骤详解

python绘制漏斗图步骤详解

pyecharts中的Funnel函数可以绘制漏斗图,自动根据数据大小生成由大到小自上而下排列的一个漏斗样的图形。 1、导入Funnel模块。 from pyecharts import...

selenium获取当前页面的url、源码、title的方法

selenium获取当前页面的url、源码、title的方法

此篇博客学习的api如标题,分别是: current_url    获取当前页面的url; page_source    获取当前页面的源码; title        获取当前页面的t...

python实现名片管理系统项目

python实现名片管理系统项目

名片管理系统,供大家参考,具体内容如下 环境要求:linux系统、python2.x或python3.x 资源地址:GitHub地址 写在前面的话:笔者之前在初学C/C++时,都曾写过类...