注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

奕克

爱家人爱工作爱生活

 
 
 

日志

 
 

Data.Mining.with.Microsoft.SQL.Server.2008阅读笔记  

2010-07-14 14:44:14|  分类: 转载 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
1.When choosing attributes for data mining, you should be careful to choose attributes that are likely to be relevant to your question and provide information that can be used by the data mining algorithm. Many attributes are not suitable for data mining, at least not in the form that they exist within your data.
 
2.This is done either for convenience (sometimes ranges are easier to understand than means and standard deviations), or because the target algorithm does not support continuous types and only works with categorical data (such as association rules).
 
3.keep in mind that the more attributes you have, the more examples are needed to elicit information from those attributes.as you add more attributes, the combinations grow, and more data is required to find good patterns.
 
4.Associated with each categorical attribute is its set of possible values, or states.A marital status attribute may have the states Married and Single. Just as with attributes, it is important to limit the states of an attribute to those relevant to the problem.Most algorithms have parameters to limit the number of states allowed for any particular attribute.
 
5.InSQLServer Data Mining, all attributes have the implied Missing state.The Missing state is also frequently used when a previously unseen value is encountered during the prediction phase.SQL Server will automatically replace that value with the Missing state.
 
6.A case represents the entity you are mining — that thing you are asking the question about. In the simplest situations (and, in fact, most situations), a case is represented by a row in a table, with the table columns representing attributes.  
 
7.When a transaction or transaction-like table appears in a case, it is called a nested table. Likewise, any case containing a nested table is often referred to as a nested case. DMX allows for arbitrarily complex cases. A case can contain attributes
represented by columns in a row (referred to as case-level attributes) and multiple transaction tables (or nested tables) containing nested attributes. This flexibility in modeling provides the freedom to include all relevant attributes in your analysis
 
DMX references two different types of columns as keys. The first is the case key that indicates the identity of the entity represented by the case. the nested key indicates the named  entity of the nested row.A common mistake is to use a foreign key as a nested key.
page 91
  评论这张
 
阅读(132)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017