解析URL文本中的主题标签

时间:2016-11-18 22:16:57

标签: excel csv parsing twitter

我已经在csv文件中提取了所有推文,我想从主题标签和网址中分离twitter文本,到目前为止,我已经使用

分离了excel中的主题标签
  

数据 - >文本到列

首先,我不知道如何使用此方法分隔网址 第二是有更好的方法吗?所有在线链接在报废时都将两者分开

<select id="chapters">
  <option value="">Choose one</option>
  <option value="Alpha">Alpha</option>
  <option value="Beta">Beta</option>
  <option value="Gamma">Gamma</option>
  <option value="Delta">Delta</option>
  <option value="Epsilon">Epsilon</option>
</select>

<select id="options">
</select>


<input name="line" id="line" />

这应该是什么样子

TEXT
Learned a new concept today : metamorphic testing.  http:/t.co/0is1IUs3aW
variant identification in pooled DNA using R http:/t.co/4PQfUaU
Meta-All: a system for managing metabolic pathway information http:/t.co/2PfJXUxq2X

现在,文本和网址都在一列中,我想将它们放在不同的列中

2 个答案:

答案 0 :(得分:0)

我会使用一组简单的公式。

=find()    
=left()    
=Right()

Here are the formula's I used

Here are the results of those formulas

基本上,find()公式允许你找到&#34;&#34; Http:&#34;在你的字符串中。 Left()允许您打印()左边的所有内容。 Right()可以让你把所有东西都拿到右边。

答案 1 :(得分:0)

从A2提取网址:=MID(A2,FIND("http",A2),500)

A2的其余部分:=MID(A2,1,FIND("http",A2)-1)

enter image description here

相关问题